TW200939210A - Systems, methods, and apparatus for multi-microphone based speech enhancement - Google Patents

Systems, methods, and apparatus for multi-microphone based speech enhancement Download PDF

Info

Publication number
TW200939210A
TW200939210A TW097149913A TW97149913A TW200939210A TW 200939210 A TW200939210 A TW 200939210A TW 097149913 A TW097149913 A TW 097149913A TW 97149913 A TW97149913 A TW 97149913A TW 200939210 A TW200939210 A TW 200939210A
Authority
TW
Taiwan
Prior art keywords
signal
filter
spatial processing
processor
channel
Prior art date
Application number
TW097149913A
Other languages
English (en)
Inventor
Kwok-Leung Chan
Jeremy Toman
Erik Visser
Hyun-Jin Park
Brian Momeyer
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of TW200939210A publication Critical patent/TW200939210A/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02165Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Telephone Function (AREA)

Description

200939210 九、發明說明: 【發明所屬之技術領域】 本揭示案係關於語音處理。
本專利申請案主張以下臨時申請案之優先權:2007年12 月 19 日申請之名為"SYSTEM AND METHOD FOR MULTIMICROPHONE BASED SPEECH ENHANCEMENT IN
HANDSETS”的臨時申請案第61/015,084號;2007年12月26 曰申請之名為"SYSTEM AND METHOD FOR MULTI-赢 MICROPHONE BASED SPEECH ENHANCEMENT IN
HANDSETS"的臨時申請案第61/016,792號;2008年6月30 曰申請之名為"SYSTEM AND METHOD FOR MULTIMICROPHONE BASED SPEECH ENHANCEMENT IN HANDSETS”的臨時申請案第61/077,147號;及2008年7月9 日申請之名為"SYSTEMS,METHODS,AND APPARATUS FOR MULTI-MICROPHONE BASED SPEECH ENHANCEMENT"的臨 時申請案第61/079,359號,該等申請案讓與給其受讓人。 φ 【先前技術】 可在不可避免地為吵雜之環境中俘獲資訊信號。因此, 可能需要自包括來自所要資訊源之信號及來自一或多個干 擾源之信號的若干源信號之疊加及線性組合當中區分資訊 信號。此問題可出現於用於話音通信(例如,電話)之各種 聲學應用中。 分離信號與此混合物之一方法係以公式表示近似混合環 境之逆環境的非混合矩陣。然而,實際俘獲環境通常包括 137174.doc -6- 200939210 諸如時間延遲、多路、反射、相位差、回音及/或混響之 效應。此等效應產生源信號之卷積混合物— ure) #可引起傳統線性模型化方法之問題且亦可為 頻率依賴性的。需要開發用於分離一或多個所要信號與此 等混合物之信號處理方法。 -人可能需要使用話音通信頻道而與另—人通#。頻道 可(例如)由行動無線手機或頭戴式耳機、對講機、雙向無 線電、汽車套組或其他通信器件提供。當人講話時,通信 器件上之麥克風接收人之話音的聲音且將其轉換為電子信 號:麥克風亦可自各種雜訊源接收聲音信號,且因此,電 子㈣亦可包括雜訊分量。由於麥克風可位於距人之口的 某距離處,且環境可具有許多不可控制之雜訊源,所以雜 訊分量可為信號之實質分量。此實質雜訊可引起不令人滿 意之通信體驗及/或可導致通信器件以低效方式而操作。 ❹ 聲學環境通常為吵雜的,從而使得難以可靠削貞測所要 資訊信號且對所要資訊信號做出反應。在—特定實例中, 語=信號在吵雜環境中產生,且語音處理方法用以分離語 音^與環境雜訊°此語音信號處理在日常通信之許多領 域中為重要的,因為雜訊在真實世界條件下幾乎一直存 在。雜訊可經界定為干擾所關注語音信號或使所關注 之所有信號的組合。真實世界由包括單點雜訊源 之多個雜訊源充滿,多個雜訊源通常侵越為多個聲音,從 而導致混響。除非分離及隔離所要語音信號與背景雜訊, 否則可能難以可靠且有效地使用所要語音信號。背景雜訊 137174.doc 200939210 可包括由-般環境所產生之許多雜訊信號,及由其他人之 背景會》炎所產生之信號,以及自信號中之每一者所產生的 反射及混響。對於通信發生於吵雜環境中之應用而言,可 能需要分離所要語音信號與背景雜訊。 用於刀離所要聲音信號與背景雜訊信號之現有方法包括 簡單濾波過程。雖然此等方法對於聲音信號之即時處理可 能為足夠簡單且快速的,但其不能容易地調適成用於不同 聲曰%境且可導致所要語音信號之實質降級。舉例而言, © 4程可根據為過度包含之雜訊特性之預定假設集合而移除 分量,使得將所要語音信號之部分分類為雜訊且移除。或 者,過程可根據為過少包含之雜訊特性之預定假設集合而 移除分量,使得將背景雜訊之部分(諸如,音樂或會談)分 類為所要信號且保留於經濾波輸出語音信號中。 如同PDA及蜂巢式電話之手機作為選擇之行動語音通信 器件而快速地出現,從而充當對蜂巢式網路及網際網路之 行動存取的平台。先前在安靜辦公室或家庭環境中之桌上 Ο 型電腦、膝上型電腦及辦公室電話上所執行之愈來愈多的 功能正在如同汽車、街道或咖啡廳之曰常情形中得以執 行。此趨勢意謂實質量之話音通信正發生於使用者由其他 人包圍之環境中,環境具有在人傾向於聚集時通常所遭遇 之雜訊内容種類。此雜訊種類(包括(例如)競爭對話器、音 樂、串音、機場雜訊)之簽名通常為非靜止的且靠近於使 用者自身之頻率簽名,且因此,此雜訊可能難以使用傳統 單重麥克風或固定波束成形類型方法來模型化。此雜訊亦 137174.doc 200939210 在電話會談中使使用者分心或煩惱。此外,許多標 準自動化商業交易(例如,帳戶結餘或股票報價帳單)使用 基於話音辨識之資料詢問’且此等系統之精度可能受到干 擾雜訊顯著地妨m,可能需要基於多重麥克風之進 階信號處理(例如)以支援吵雜環境中之手機使用。 【發明内容】
根據一通用組態,一種處理包括語音分量及雜訊分量之 Μ頻道輸入信號(]^為大於一之整數)以產生經空間濾波輸 出信號的方法包括:將第—空間處理滤波器應用至輸入信 號;及將第二空間處理濾波器應用至輸入信號。此方法包 括:在第一時間’判定第一空間處理濾波器優於第二空間 處理遽波器而開始分離語音分量與雜訊分量;及回應於在 第一時間之該判定,產生基於第一經空間處理信號之信號 作為輸出信號。此方法包括:在第一時間之後的第二時 間’判定第二空間處理濾波器優於第一空間處理濾波器而 開始分離語音分量與雜訊分量;及回應於在第二時間之該 判定’產生基於第二經空間處理信號之信號作為輸出信 號。在此方法中,第一經空間處理信號及第二經空間處理 信號係基於輸入信號。 亦描述此方法之實例。在一此實例中’一種處理包括語 音分量及雜訊分量之Μ頻道輸入信號(Μ為大於一之整數) 以產生經空間濾波輸出信號的方法包括:將第一空間處理 濾波器應用至輸入信號以產生第一經空間處理信號;及將 第二空間處理濾波器應用至輸入信號以產生第二經空間處 137174.doc 200939210 理信號。此方、土 — a 法匕括.在第一時間, 波器優於第-咖θ疋第—空間處理濾 乐一空間處理濾波器而開 分量,·及回;Μ 4 】。刀離浯音分量與雜訊 W應於在第一時間之該 理信號作為輪出 疋產生第一經空間處 二時間,判宏埜 ^ 在第一時間之後的第 器而開始分離纽立八县办 優於第一空間處理濾波 刀離房音分量與雜訊分量. 之該判定,產生筮_ P咖 ,。應於在第二時間 根據另-诵爾爽里乜説作為輪出信號。 训佩乃 通用組態,一插田认占 分量之Μ用於處理包括語音分量及雜訊 刀重之Μ頻道輸入信號(Μ為大於 滹玻輪屮产缺ΛΑ « 之整數)以產生經空間 /慮皮輸出W的裝置包括用於對輸入 理操作的構件,W於對輸 ^了帛工間處 ^ # 〇 ^ w,χ 。號執仃第二空間處理操作
的構件。裝置包括用於在第一時間 J 處理操作之構件優於用於執 * 、 T 工間 開始分離語音分量與雜%八 霉件而 該用於在第一時間之判定 、自 ^ . 稱件的扣不而產生基於第一蠖 空間處理信號之信號作為铪山 > 上 、、良 為輸出杬唬的構件。裝置包括用於 在第一時間之後的第二時$ ' 〜 吁間判定用於執行第二空間處理接 作之構件優於用於執行第一 * 、 二間處理操作之構件而開始分 離語音分量與雜訊分量的構件, 刀 备也 再1干及用於回應於來自該用於 在第二時間之判定之構件 、 件的扣不而產生基於第二經空間 理信號之信號作為輪出信妒的播 就的構件。在此裝置中,第一链 空間處理信號及第二經空間虛 、 間處理k旒係基於輸入信號。
根據另一通用組態,_锸田从A 種用於處理包括語音分量及雜 分量之Μ頻道輸入信號為女 ° 1Μ為大於一之整數)以產生經空間 137174.doc 200939210 渡波輸出信號的裝置包括:第-空間處理濾波器,其經組 態以對輸入信號進行滤波;及第二空間處理渡波器,其經 組態以對輸入信號進行渡波。裝置包括狀態估計器,其經 組態以在第-時間指示第一空間處理濾波器優於第二空間 處理慮波器而開始分離語音分量與雜訊分量。裝置包括轉 變控制模組,其經組態以回應於在第—時間之指示而產生 基於第-經空間處理信號之信號作為輸出信號。在此裝置 中,狀態估計器經組態以在第一時間之後的第二時間指示 © 帛二空間處理渡波器優於第—空間處理漉波器而開始分離 語音分量與雜訊分量,且轉變控制模組經組態以回應於在 第二時間之指示而產生基於第二經空間處理信號之信號作 為輸出信號。在此裝置中,第一經空間處理信號及第二經 空間處理信號係基於輸入信號。 根據另一通用組態,一種包含指令(指令在由處理器執 行時使處理器執行處理包括語音分量及雜訊分量之M頻道 輸入信號(Μ為大於一之整數)以產生經空間渡波輸出信號 © 的方法)之電腦可讀媒體包括在由處理器執行時使處理器 對輸入信號執行第一空間處理操作的指令,及在由處理器 執行時使處理器對輸入信號執行第二空間處理操作的指 令。媒體包括在由處理器執行時使處理器在第一時間指示 第一空間處理操作優於第二空間處理操作而開始分離語音 分量與雜訊分量的指令,及在由處理器執行時使處理器回 應於在第一時間之該指示而產生基於第一經空間處理信號 之信號作為輸出信號的指令。媒體包括在由處理器執行時 137174.doc -11 - 200939210 使處理器在第一時間之後的第二時 间扣不第二空間處理椏 :優:第一空間處理操作而開始分離語音分量與雜訊分: =:及在由處理器執行時使處理器回應於在第二時; 信唬之信號作為輪屮 仏就的指令。在此實例中,第一 $ 、工間處理信號及第_ ^ 空間處理信號係基於輸入信號。 一經 【實施方式】 ❹ 本揭示案係關於用於分離聲學信號與吵雜環境 方法及裝置。此等組態可包括分離聲學信號與聲學信號之 混合物。可藉由使用固定據波級㈣,具有以固 值進行組態之遽波器的處理級)來執行分離操作以自聲風 k號之輸入混合物内隔離所要分 予 刀置亦描述可實施於多重 麥克風掌上型通信器件上之紐能 A热 之組態。此組態可適合於處理由 通信器件所遭遇之可能包含千墦 此匕3干擾源、聲學回音及/或經办 間分布背景雜訊的雜訊環境。 二 本揭示案亦描述用於藉由 精由使用一或多個盲源分離 (BSS)、波束成形及/或經組人 人、生殂。BSS/波束成形方法來處理使 用通信器件之麥克風随况丨& — 兄凤陴列而圮錄之訓練資料而產生一滹、、皮 器係數值集合(或多個滹、、古哭# & 麻入 ”固,慮波器係數值集合)的系統、方法及 裝置0訓練資料可基於才日#4_ # ± λ鬼 ^ 於相對於陣列之各種使用者及雜訊源 位置以及聲學回音(例如, 采自通k器件之一或多個擴音 1§)。該麥克風陣列或且古^ 、 具有同一組態之另一麥克風陣列可 接者用以獲付將如上文所扭η ^ 文所棱及進行分離之聲學信號的輸入 混合物。 137174.doc -12- 200939210 本揭示案亦描述將所產生濾波器係數值集合提供至固定 滤波級(或"濾波器組")之系統、方法及裝置。此组態可包 括切換操作’切換操作基於通信器件相對於使用者之當前 所識別定向而在固定濾'波級内之所產生滤波器係數值集合 當中(且可能在用於後續處理級之其他參數集合當中)進行 選擇。 本揭示案亦描述使用調適性(或部分調適性)Bss、波束 成形或經組合BSS/波束成形濾波級而對如上文所描述的基 © 於固定濾波級之輸出的經空間處理(或”分離”)信號進行渡 波以產生另一經分離信號的系統、方法及裝置。此等經分 離信號中之每-者可包括一個以上輸出頻道,使得輸出頻 道中之至少一者含有所要信號與經分布背景雜訊,且至少 一其他輸出頻道含有干擾源信號與經分布背景雜訊。本揭 示案亦描述包括後處理級(例如,雜訊降低濾波器)之系 統、方法及裝置,後處理級基於由另一輸出頻道所提供之 雜訊參考而降低載運所要信號之輸出頻道中的雜訊。 © 本揭示案亦描述可經實施以包括以下各項之組態:參數 之調諧、初始條件及濾波器集合之選擇 '回音消除,及/ 或藉由切換操作而進行之在一或多個分離或雜訊降低級之 固定濾波器係數值集合之間的轉變處置。系統參數之調諧 可視基頻晶片或晶片組之本質及設定及/或網路效應而 定’以最佳華總雜訊降低及回音消除效能。 除非受到内容明確地限制,否則術語"信號"在本文中用 以指示其普通意義中之任一者,包括在導線、匯流排或其 B7174.doc •13- 200939210 他傳輸媒體上所表達之記憶體位 狀態。除非受到内容明確 隐體位置集合)的 中用以指示其普通意義中之 -產生在本文 生。除非受到内容明確地 ,叶算或另外產 用以指示其普通意義中之任 十鼻在本文中 或自值集合進行選擇。除’計算、評估及/ 語"獲得”心指示其u確地_,否則術 道山„ θ通意義中之任-者,諸如,計算、
陣收(例如,自外部器件)及,或梅取(例如,自儲存 ^=列)。在本描述及申請專利範圍中使用術語”包含"之 二=除其他元件或操作。術語”基於"( 用以指示其普通意義中之任-者,包括以下狀 _ 少基於”(例如,”Α係至少基於Β");及(在特定 情形中適當時XU)”等於”(例如,”Α等於ΒΊ。類似地,術 语"回應於”用以指示其普通意義中之任一者,包括"至少 回應於"。 除非另有指示’否則具有特定特徵之裝置之操作的任何 揭不亦明確地意欲揭示具有類似特徵之方法(且反之亦 然)’且根據特定組態之裝置之操作的任何揭示亦明確地 :欲揭示根據類似組態之方法(且反之亦然)。如由特定内 容所指示,可根據方法、裝置或系統來使用術語”組態,,。 示非由特疋内容另外指示,否則一般地且互換地使用術語 方法"、"過程”、"程序"及”技術"。除非由特定内容另外 扣示,否則亦一般地且互換地使用術語••裝置"及"器件"。 術語”几件"及"模組"通常用以指示較大組態之一部分。文 137174.doc 14 200939210 獻之一部分以引用之方式的任何併入亦應被理解為併入有 在該部分内所引用之術語或變數之界定(其中此等界定顯 現於該文獻之其他地方)以及在所併入部分中所引用之任 何圖。 可能需要產生具有兩個或兩個以上麥克風之用於攜帶型 話音通信之器件。由多重麥克風所俘獲之信號可用以支援 空間處理操作,空間處理操作又可用以提供增加之感性品 質,諸如,較大雜訊抑制。此器件之實例包括電話手機 ❹(例如,蜂巢式電話手機)及有線或無線頭戴式耳機(例如, 藍芽頭戴式耳機)。 圖1A展示處於第一操作組態之兩麥克風手機hi〇〇(例 如,蛤殼型蜂巢式電話手機卜手機钔〇〇包括主要麥克風 動0及次要麥克風MC2〇。在此實例中,手機〇亦包括 主要揚聲器SP10及次要揚聲器SP20。 當手機H100處於第一操作組態時,主要揚聲器卯…為 活動,且次要揚聲器SP20可經去能或另外經消音。可能需 參要使主要麥克風MC10及次要麥克風批2。在此組態_皆保 持為活動以支援用於語音加強及/或雜訊降低之空間處理 技術。圖2展示在用於此操作組態之可能定向範圍内的兩 者。在此定向範圍内,手機H100固持至使用者之頭部,使 得主要揚聲器SP10靠近於使用者之耳朵,且主要麥克風 MC10接近使用者之口。如圖2所示,主要麥克風μ⑽與 使用者之口之間的距離可變化。圖2亦說明可能之干擾聲 曰佗號,諸如,可由主要揚聲器spi〇回應於遠端信號而產 137174.doc w 200939210 生之口曰,及可為指向及/或漫射之雜訊。圖3八及圖邛展 不使用者可使用手機H100之此操作組態的兩個其他可能定 向(例如’處於揚聲器電話或即按即說模式)。當揚聲器電 =即按即說模式在手機H副之此操作組態中為活動時, σ需要使-人要揚聲器SP20為活動且可能使主要揚聲 SP10去能或另外消音。 〇 鲁 圖職示手機H100之第二操作組態。在此組態中,主 要麥克風MC10被關閉’次要揚聲器sp2〇為活動,且主 揚聲器SPH)可經去能或另外經消音。再次,可能需要使主 要麥克風MCiO及次要麥克風霞2〇兩者在此組態中皆保持 為活動(例如’以支援空間處理技術)。圖4A及圖扣展示使 用者可使用手細00之此操作組態的兩個不同可能操作定 。手機H1 〇〇可包括一或多個開關,一或多個開關之狀離 指示器件之當前操作組態。 〜 如以上諸®所示,蜂巢式電話手機可支援各種不同可能 位置使用’每-位置使用與器件之麥克風與使用者之口之 間的不同空間關倍相關胳 a» / t 、關聯舉例而言,可能需要使手機 刪0支援諸如全雙工揚聲器電話模式及/或半雙工即按即 說(PTT)模式之特徵’可能預期該等模式涉及比圖2所示之 習知電話操作模式之位置改變範圍廣泛的位置改變範圍。 回應於此等位置改變而調適空間處理濾波器之問題可能過 於複雜而不能即時地獲得渡波器收斂。此外,隨時間而充 分地分離可自若干不因古a 不门方向到達之語音信號與雜訊信號之 問題可能過於複雜而;^ + s 獲雜而不月b由單一空間處理濾波器解決。可 I37174.doc 200939210 =要使此手機包括具有-個以上空間處理據波器之遽波 聲立\(^狀況下’可能需要使手機根據器件相對於所要 使用者之口)之當前定向而自此組選擇空間 圖5說明對應於手機H1〇〇相對於所要聲音源(例如,使用 者之口)之三個不同定向狀態的區域。當手機相對於所要 源而定向以使得所要聲音(例如,使用者之話音)自區域 ❹
中之=向到達時,可能需要使手機使用指向於區域Μ且傾 向於衰減來自其他方向之信號的濾波器。同樣地,當手機 相對於所要源而定向以使得所要聲音自區域A2中之方向到 達時,可能需要使手機使用指向於區域八2且傾向於衰減來 =其他方向之信號的不同滤波器。當手機相對於所要源而 疋向以使侍所要聲音自區域A3中之方向到達時,可能需要 使手機不使用最初兩個濾波器中之任一者。舉例而言,在 此狀況下,可能需要使手機使用第三濾波器。或者,在此 狀況下,可能需要使手機進入單頻道模式,使得僅一麥克 風為活動(例如’主要麥克風·。),或使得當前為活動之 麥克風混合至單頻道,且可能需要暫時中止空間處理操 作。 應注思,圖5所示之區域邊界僅係為了視覺說明性目 的,且其不聲稱展示與各種定向狀態相關聯之區域之間的 斤'邊界圖6A至圖6C展示源原點區域之三個另外實 例’對於該等源原點區域,可能預期一空間分離渡波器優 於另二間分離濾波器而執行。此等三個圖說明濾波器中 137174.doc -17- 200939210 之兩者或兩者以上對於超出距手機之某距離之源可同等良 好地執行(此定向亦被稱為"遠場情境”卜此距離可極大地 視器件之麥克風之間的距離(其對於手機而言通常為⑽ 刀,且對於頭戴式耳機而言可能甚至更小)而定。圖 6C展示一實例’在該實例中,兩個區域重疊,使得可預期 兩個相應遽波器對於位於重疊區域中之所要源同等良好地 執行。 通信器件(例如,手機H1〇〇)之麥克風中之每一者可具有 ©為全向、雙向或單向(例如’心形)之回應。可能使用之各 種麥克風類型包括屢電麥克風、動態麥克風及駐極體麥克 :。此器件亦可經實施以具有兩個以上麥克風。舉例而 言,圖7A展示包括第三麥克風MC3〇之手機hi〇〇的實施例 HU0。圖7B展示手機Hu〇之兩個其他視圖,其展示各種 傳感器沿器件之轴線的置放。 圖8展不根據一通用組態之裝置八2〇〇的方塊圖,裝置 A200可實施於如本文中所揭示之通信器件(諸如,手機 ® H100或H11G)内。裝置A2GG包括經組態以接收咖道輸入 信號S10之滤波器組1〇〇,其中河為大於一之整數,且_ 頻道中之每一者係基於Μ個麥克風(例如,手機H1〇〇或 11〇之麥克風)中之—相應麥克風的輸出。麥克風信號通 常、’呈取樣、可經預處理(例如,針對回音消除、雜訊降 低、頻譜成形等等而經濾波),且可甚至經預分離(例如, 藉由如本文中所描述之另一空間分離濾波器或調適性濾波 器)。對於諸如語音之聲學應用而言,典型取樣速率在自8 I37174.doc -18- 200939210 kHz至16 kHz之範圍内。 濾波器組100包括η個空間分離濾波器fi〇_i至Fl〇-n(其中 η為大於一之整數),其中之每一者經組態以對μ頻道輸入 信號S40進行濾波以產生相應經空間處理μ頻道信號。空 間分離濾波器F10-1至Fl〇-n中之每一者經組態以分離河頻 道輸入信號之一或多個指向所要聲音分量與信號之一或多 個其他分量(諸如,一或多個指向干擾源/或漫射雜訊分 量在圖8之實例中,濾波器!^…」產生包括經濾波頻道 O S2〇ll至S2〇ml之Μ頻道信號,濾波器F1〇_2產生包括經濾 波頻道S2〇12至S20m2之Μ頻道信號,等等。濾波器卩⑺巧 至FlO-η中之每一者係藉由一或多個係數值矩陣而特徵 化,一或多個係數值矩陣可使用BSS、波束成形或經組合 BSS/波束成形方法(例如,如本文中所描述之1〇八或方 練。在一些狀況下,係數值矩陣可僅為係數值向量(亦 。裝置A200亦包括切換機構35(),其經組態
法或其變化)進行計算, 即,一維矩陣) G 且亦可如本文中所描述而進行訓
I37174.doc 200939210 如,蜂巢式電話手機)之通信而支援半雙工或全雙工電話 (例如,使用如由 BlUet00th Special lnterest 〜。up,Ine, ^丨levUe,WA所頒布之Bluet〇〇thTM協定之版本)。圖’9展示 諸如經安裝以供在使用者之耳朵65上使用之頭戴式耳機w 之不同操作組態範圍66的圖解。頭戴式耳機63包括主要 (例如,端射)及次要(例如,橫向)麥克風陣列67,該陣列 可在使用期間相對於使用者之口 64而不同地定向。 為了在描述中避免不當之複雜性,本文中在裝置A2〇〇之 ® 兩頻道及/或兩濾波器實施例的情形中描述所揭示組態之 一些特徵,但仍然應理解,在此實施例之情形中所描述之 任何特徵皆可通用化至Μ頻道及濾波器實施例,且明 確地預料及揭示此通用化。 圖10展示裝置A200之兩頻道(例如,立體聲)實施例A21〇 的方塊圖。裝置A2 10包括濾波器組1 〇〇之實施例丨2〇,濾波 器組120包括η個空間分離濾波器F14-1至F14-n。此等空間 分離濾波器中之每一者為濾波器FWq至F1〇 n中之一相應 Ο 濾波器的兩頻道實施例,其經配置以對兩個輸入頻道S10_ 1及S10_2進行濾波以在兩個經濾波頻道(例如,語音頻道 及雜訊頻道)上產生相應經空間處理信號。濾波器F14-1至 F14 η中之每一者經組態以分離輸入信號s丨〇之指向所要聲 曰匀量與k號之一或多個雜訊分量。在圖10之實例中,濾 波器F14-1產生包括語音頻道S2〇u及雜訊頻道S2〇21之兩 頻道信號’濾波器F14-2產生包括語音頻道82012及雜訊頻 道S2022之兩頻道信號,等等。裝置a21〇亦包括切換機構 137174.doc -20- 200939210 350之實施例360 ’切換機構36〇經組態以自濾波器fi4-1至 FM-η中之每一者接收兩個經濾波頻道、判定此等濾波器 中之哪一者當前最好地分離輸入信號S10之所要分量與雜 訊分量’且產生兩個輸出頻道S4〇_i及S40-2之選定集合。 圖11展示裝置A210之特定實施例A220,特定實施例 A220包括渡波器組12〇之兩濾波器實施例13〇。濾波器FU-1及F14-2可如本文中所描述而進行訓練及/或設計。濾波器 組130亦可經實施,使得濾波器1?14_1與1?14_2具有彼此大 © 體上相同但以不同次序之係數值》(在此情形中,術語"大 體上”指示在1%、5%或1〇%之誤差内。)在一此實例中,濾 波器F14-1與F14-2具有彼此大體上相同 但以不同次序之係 數值。(在一特定實例中,濾波器F14-1具有V個係數值〜至 av之向量,且濾波器F14_2具有以逆序、至㈨之大體上相同 值之ντο素向量。)在另一此實例中,濾波器FM — 丨具有v行 係數值A〗至Av(每一行表示對輸入頻道中之一各別輸入頻 道的濾波操作)之矩陣,且濾波器F14_2具有乂行矩陣其 © 4有以不同次序之大體上相同行。(在一特定實例中,濾 波器F14-1之係數值矩陣圍繞中心垂直轴線而經翻轉以獲 得遽波器F14-2之係數值矩陣)。在此等狀況下,可預期濾 波器F14_mF14_2具有不同(例如,大約互補)空間分離: 能舉例而έ,一渡波器可在所要聲音源處於諸如圖$中 之區域Α1的區域中時執行所要聲音至相應語音頻道之較好 分離,而另-濾波器可在所要聲音源處於諸如圖5中之區 域Α2的相反區域中時執行所要聲音至相應語音頻道之較好 137174.doc 21 200939210 分離。或者,濾波器組130可經實施,使得濾波器F14_1與 F14-2在結構上相似,其中濾波器F14-2之係數值中之每一 者大體上等於濾波器F14-1之相應係數值的加法逆元素(亦 即’具有相同量值及相反方向,以在1 %、5%或1 〇%之誤 差内)。 手機或頭戴式耳機之典型使用僅涉及一所要聲音源:使 用者之口。在此狀沉下,僅包括兩頻道空間分離濾波器之 漉波器組120之實施例的使用可能為適當的。亦明確地預
❹ 料及揭示在用於音訊及/或視訊會議之通信器件中包括裝 置A200之實施例。對於用於音訊及/或視訊會議之器件而 言,器件之典型使用可涉及多個所要聲音源(例如,各個 參與者之口)。在此狀況下,包括R頻道空間分離濾波器 (其中R大於二)之濾波器組100之實施例的使用可能為更適 當的。通常,可能需要使濾波器組1〇〇之空間分離濾波器 具有用於每一指向聲音源之至少一頻道及用於漫射雜訊之 一頻道。在一些狀況下,亦可能需要提供用於任何指向干 擾源中之每一者的額外頻道。 圖12展不包括狀態估計器4〇〇及轉變控制模組5〇〇之切換 機構3 5 0之實施例3 5 2的方塊圖。回應於來自狀態估計器 400之經估計定向狀態指示(或”經估計狀態,轉變控 制模組500經組態以自經濾波頻道至S2〇in· S20rnn之n個集合當中進行選擇 以產生Μ個輸出頻道S40-1 至S40-m之集合。 的方塊圖,特定 圖13展示切換機構352之特定實施例362 實施例362包括狀態估計器4〇〇之實施例 137174.doc -22- 200939210 401及轉變控制模組500之實施例501,其中Μ之值等於 狀態估計器400可經實施以基於以下各項來計算經估計 狀態指示S50: —或多個輸入頻道si〇-i至si〇-m、一或多 個經濾波頻道S2011至S20mn,或輸入頻道與經濾波頻道 之組合。圖14A展示經配置以接收η個語音頻道S2011至
S201n及η個雜訊頻道S202a至S202n之狀態估計器401的實 施例402。在一實例中,狀態估計器4〇2經組態以根據表達 式max[邮(對於1 y “)來計算經估計狀態指示S5〇, 其中五(\)指示語音頻道S2〇li之能量,且£(乂)指示雜訊頻 道S2021之能量。在另一實例中,狀態估計器4〇2經組態以 根據表達式]來計算經估計狀態指示S5〇, 其中,指示與濾波器F丨〇_丨相關聯之優選常數。可能需要組 態狀態估計器400以回應於通信器件之操作組態及/或操作 模式之改變而向一或多個優選常數G中之每一者指派不同 值。 狀態估計器4〇2可經組態以計算能量值石队)及五㈧)之每 -例項作為由相應頻道所載運之信號之連續樣本區塊(亦 被稱為"訊框")的平方樣本值之和。典型訊框長度在約五或 十毫秒至約四十或五十毫秒之範_,且訊框可為重疊的 或非重疊的°如藉由—操作而處理之訊框亦可為如藉由不 同,作而處理之較大訊框的片段(亦即,"子訊框")。在一 特疋實例中’由經濾、波頻道S2GU至請以所載運之信號分 為1〇毫秒非重疊訊框之序列,且狀態估計器402經組態以 I37174.doc -23· 200939210 針對經濾波頻道S2011及S2012中之每一者之每一訊框而計 算能量值五(&)之例項,且針對經濾波頻道S2021及S2022中 之每一者之每一訊框而計算能量值五(7\g之例項。狀態估計 器402之另一實例經組態以根據表達式mh^ATdAg)(或 ((5"’,^’)) + <::’)(對於1^”)來計算經估計狀態指示850,其 中corr(A,B)指示A與B之相關。在此狀況下,可在如上文 所描述之相應訊框上計算相關之每一例項。 圖14B展示經配置以接收η個輸入頻道810_1至81〇_111及11 ❹ 個雜訊頻道S2021至S202n之狀態估計器401的實施例404。 在一實例中,狀態估計器404經組態以根據表達式 _网心)-即(或酿叹)一职) + c])(對於⑻“且⑸叫來 計算經估計狀態指示S50,其中研/;)指示輸入頻道§1〇^之 能量。在另一實例中,狀態估計器4〇4經組態以根據表達 式max[則-取,)](或_[即)_,)$])(對於匕·㈤來計算經 估計狀態指示S50,其中E⑴指示輸入頻 中之選定輸入頻道I的能量。在此狀沉下,頻道u可能載 ©冑所要語音信號之輸人頻道。可基於器件内之相應麥克風 之實體位置來選擇頻道〖。或者,可基於輸入頻道中之兩 者或兩者以上(可能全部)之信雜比的比較來選擇頻道卜 圖14C展示經配置以接收n個語音頻道S2〇i丨至s2〇in之狀 態估計器401的實施例偏。狀態估計器偏經組態以選擇 :應於具有語音量測(例如,語音特性量測)之最高值之語 玲頻道的狀態。在一實 >(歹丨丨φ,仙台巨y丄 中狀U古汁器406經組態以基 於語音頻道SWS20ln之相對自相關特性來計算經估計 137174.doc •24- 200939210 狀態指示S50。在此狀況下’當前正載運在預期人類間距 滯後值範圍内具有自相關峰值之信號的頻道可能優於當前 正載運僅在零滯後處具有自相關峰值之信號的頻道。在另 一實例中,狀態估計器406經組態以基於語音頻道s2〇 11至 S201n之相對峰度(例如,四階矩)特性來計算經估計狀態 才a示S50。在此狀況下,當則正載運具有較高峰度之信號 (亦即’為更非高斯的)頻道可能優於當前正載運具有較低 峰度之信號(亦即,為更高斯的)的頻道。 ❹ 圖MD展示經配置以接收n個輸入頻道si(M至S10_m之 狀態估計器401的實施例408。在此狀況下,濾波器集合 F10-1至FlO-η中之每一者與到達時間差(TC)〇A)值之不同範 圍相關聯。狀態估計器408經組態以估計輸入頻道當中之 TDOA(例如’使用基於輸入頻道之相關、輸入/輸出相關 及/或相對延遲輸入和及差之方法),且選擇對應於關聯濾 波器集合之狀態。可能需要在基於輸入信號之和及差量測 來計算延遲估計之前執行輸入頻道之低通濾波,因為此濾 © 波可有助於使延遲估計有規則及/或穩定《狀態估計器408 與狀態估計器400之其他實施例相比可能較不依賴於麥克 風增益之精確校準及/或對於校準誤差為更強健的。 可能需要組態狀態估計器4〇〇以在使用其輸入參數值來 執行經估計狀態計算(例如,如上文所描述)之前使其輸入 參數值平滑。在一特定實例中,狀態估計器4〇2經組態以 汁算語音頻道S2011至S2〇 1 n及雜訊頻道S2021至S202n中之 每一者之能量’且接著根據諸如瓦= 之線性表達 137174.doc •25- 200939210 式而使此等能量平滑,其中&表示當前經平滑能量值,五 表丁先前絰平,月能量值,五"表示當前經計算能量值,且。 表示值在零(非平滑)與諸如Q9之小於—之值(針對最大平 ’月)之間可為固定或調適性的平滑因數。在此實例中,將 &平滑應用至經計算能量值以獲得值购及卿。在其他 實例中,可將此線性平滑(及/或非線性平滑操作)應用至如 參看圖14A至圖14D所描述之經計算能量值以獲得值 购、·、則及叫)中之一或多者。或者及/或另外, 〇 可能需要選擇及/或預調節經提供至狀態估計器伽之信號 (例如,如載運於語音、雜訊及/或輸入頻道上)中之一或多 者,因為此預處理可有助於在高聲干擾源存在的情況下避 免錯誤之狀態估計。 圖15展示包括切換機構370之實施例372之裝置A22〇之實 施例A222的實例,實施例372具有(A)經組態以處理來自兩 個濾波器之頻道的狀態估計器402之實施例412,及(B)轉 變控制模組5 01之相應實施例51 〇。圖16展示狀態估計器 ® 412之實施例414的實例。在此實例中,分離量測計算器 550a計算信號S2011與S2021之間的能量差,分離量測計算 器550b計算信號S2012與S2022之間的能量差,且比較器 560比較結果以指示對應於在頻道之間產生最大分離(例 如,最大能量差)之濾波器的定向狀態。在計算各別能量 差時’分離量測計算器550a及550b中之任一者(或兩者)可 經組態以根據諸如如上文所描述之A = 〇£〃 + (1 -句五”的表達 式而隨時間使經計算差平滑。比較器560亦可經組態以在 I37174.doc -26· 200939210 比較能量差之前將如上文所描述之相應濾波器優選常數添 加至能量差中之一者或兩者。此等原理可延伸至狀態估計 器402之其他實施例(例如,對於大於二之]^值),且可以類 似方式來實施狀態估計器4〇4及4〇6。亦應注意,狀態估計 器4〇〇可經組態以基於參看實施例4〇2、4〇4、406及408所 描述之技術當中的兩者或兩者以上之組合來產生經估計狀 態 S50。 對於在期間無輸入頻道含有所要語音分量之時間間隔 ® (例如,在僅雜訊時間間隔期間),可能需要抑制或去能濾 波器輸出之間的切換。舉例而言,可能需要使狀態估計器 400僅在所要聲音分量為活動時更新經估計定向狀態。狀 態估計器400之此實施例可經組態以僅在語音時間間隔期 間且不在通彳5器件之使用者未講話時之時間間隔期間更新 經估計定向狀態。 圖π展示包括話音活動性偵測器(或"VAD") 2〇及切換機構 360之實施例364之裝置A21〇的實施例A2i4。話音活動性 〇 _器難組態以產生狀態指示在輸人頻道S1(M(例如, 對應於主要麥克風MC10之頻道)上是否偵測到語音活動性 之更新控制信號S70,且根據更新控制信號S7〇之狀態來控 制切換機構360切換機構364可經組態,使得在未偵測^ 語音時之時間間隔(例如,訊框)期間抑制經估計狀態“Ο 之更新。 u 話音活動性偵測器20可經組態以基於諸如以下各項之一 或多個因數而將其輸入信號之訊框分類為語音或雜訊(例 137I74.doc -27- 200939210 如’以控制二進位話音偵測指示信號之狀態):訊框能 量、信雜比(SNR)、週期性、零點交又速率、語音及/或殘 餘之自相關’及第一反射係數。此分類可包括比較此因數 之值或量值與臨限值,及/或比較此因數之改變之量值與 臨限值。或者或另外,此分類可包括比較一頻帶中之此因 數(諸如’能量)之值或量值或此因數之改變之量值與另一 頻帶中之類似值。話音活動性偵測器2〇通常經組態以產生 更新控制信號S70作為二進位值話音偵測指示信號,但產 ❹
生連續及/或多值信號之組態亦為可能的。 圖18展示包括VAD 20及切換機構372之實施例374之裝 置220之實施例A224的方塊圖。在此實例中,更新控制信 號S70經配置以根據在輸入頻道81〇_丨上是否偵測到語音活 動性來控制狀態估計器412之實施例416(例如,以賦能或 去能經估計狀態S50之值的改變)。圖19展示包括VAD 2〇之 例項2(M及20-2之裝置A210的實施例八216,例項汕一與 20-2可能但不需要為等同的。在裝置八216之狀況下,若在 任一輸入頻道上偵測到語音活動性,則切換機構36〇之實 施例366的狀態估計器經賦能;且否則經去能。 隨著通信器件與使用者之口之間的距離增加,VAD 20 區分語音訊框與非語音訊框之能力可能降低(例如,歸因 於SNR之降低)。然而’如上文所註釋,可能需要控制狀態 估計器400以僅在語音時間間隔期間更新經估計定向狀 態。因此,可能需要使用具有高可靠度之單頻道VAD來實 施彻20(或VAD 2(M及爪2中之一者或兩者)(例如以 137174.doc 28· 200939210 在料情境下提供改良式所要揚聲器_活動性)。舉例 而可能需要實施此偵測器以基於多個準則(例如,能 量零點乂又速率,等等)及/或新近VAD決策之記_執 行話音活動性偵測。在裝置A212之另—實施例中,聊 20之例項20-1及20-2係由產生如上文所註釋可為二進位值 之更新控制信號的雙頻道VAD替換。 ^態估計器_可經組態以使用—個以上特徵來估計通 L盗件之當則定向狀態。舉例而言,狀態估計器彻可經 ❹’组態以使用上文參看圖〗4A至圖】4d所描述之一個以上準 則之”且σ。狀態估計器4〇〇亦可經組態以使用關於通信器 件之田刚狀况之其他資訊,諸如,位置資訊(例如,基於 來自。通化器件之加速計之資訊)、操作組態(例如,如由通 仏器件之狀態或一或多個開關所指示),及/或操作模式(例 如,當則選擇諸如即按即說、揚聲器電話,或是視訊播放 或°己錄之模式)。舉例而言,狀態估計器400可經組態以使 用私示哪些麥克風當前為活動之資訊(例如,基於當前操 〇 作組態)。 裝置Α20 〇亦可經建構’使得對於通信器件之一些操作組 態或模式而言’假設空間分離濾波器中之相應空間分離濾 波器提供足夠分離,使繼續之狀態估計在該器件處於彼組 態或模式中是不必要的。當選擇視訊顯示模式時,例如, 可能*需要將經估計狀態指示S50約束至特定相應值(例如, 關於使用者正面向視訊螢幕之定向狀態)。由於基於來自 輸入彳s號S1 〇之資訊之狀態估計過程必要地涉及某些延 137174.doc •29- 200939210 遲’所以使用關於通信器件之當前狀態之此資訊可有助於 加速狀態估計過程及/或降低回應於經估計狀態s5〇之改變 (諸如,對一或多個後續處理級之啟動及/或參數改變)的操 作延遲。 通仏器件之些操作組態及/或操作模式可支援尤其廣 泛之使用者器件定向範圍。當用於諸如即按即說或揚聲器 電話模式之操作模式中時,例如,通信器件可固持於距使 用者之口相對較大距離處。在此等定向中之一些中使用 © ♦之口距每一麥克風可為幾乎等距的,且當前定向狀態之 可靠估計可變得更困難。(此定向可對應於(例如)與不同定 向狀態相關聯之區域之間的重叠區域,如圖6C所示〇在 此狀況下,定向之小變化可導致經估計狀態S5〇之不必要 改變。 可旎需要組態狀態估計器4〇〇以抑制不必要改變(例如, 藉由併入有遲滞或慣性)。舉例而言,比較器56〇可經組態 以僅在(A)最大分離量測與(B)對應於當前狀態之分離量測 © 之間的差超過(或者,不小於)臨限值的情況下,更新經估 計狀態指示S50。 圖20展示轉變控制模組5〇〇之實施例52〇的方塊圖。轉變 控制模組520包括Μ個選擇器(例如,解多工器)之集合。對 於,每一選擇器j根據經估計狀態S5〇之值而輸出經 濾波頻道S20jl至S20jn當中之一者作為輸出頻道S4〇_j。 轉變控制模組520之使用可導致輸出信號S4〇自一空間分 離濾波器之輸出至另一空間分離濾波器之輸出的突然轉 137174.doc -30- 200939210 變對於通#器件當前接近兩個或兩個以上定向狀態之間 的空間邊界之情形而言,轉變控制模組520之使用亦可導 致自一濾波器輸出至另一濾波器輸出之頻繁轉變(亦被稱 為抖動)。由於各種濾波器之輸出可大體上不同,所以此 等轉變可能引起輸出信號S40之不良人為結果,諸如,所 要'-胃彳§號之臨時衰減或其他不連續性。可能需要藉由在 自一濾波器輸出至另一濾波器輸出之改變之間應用一延遲 週期(亦被稱為”滯留")而降低此等人為結果。舉例而言, ® 可能而要組態狀態估計器400以僅當在延遲時間間隔(例 如,五或十個連續訊框)内已一致地指示同一目標狀態時 更新經估計狀態指示S5(^狀態估計器4〇〇之此實施例可經 組態以針對所有狀態轉變而使用同一延遲時間間隔,或根 據特定源及/或潛在目標狀態而使用不同延遲時間間隔。 輸出信號S40之濾波器輸出之間的突然轉變感性上可為 不良的’且可能需要在濾波器輸出之間獲得比由轉變控制 模組520所提供之轉變更平緩的轉變。在此狀況下,可能 © 需要使切換機構350隨時間而自一空間分離濾波器之輸出 平緩地衰退至另一空間分離濾波器之輸出。舉例而言,除 了應用如上文所論述之延遲時間間隔以外或在應用如上文 所論述之延遲時間間隔的替代例中,切換機構35〇可經組 態以在若干訊框(例如,十個20毫秒訊框)之合併時間間隔 内執行自一濾波器之輸出至另一濾波器之輸出的線性平 滑。 圖21展示轉變控制模組500之實施例55〇的方塊圖。代替 137174.doc -31 200939210 模組520之解多工器陣列,轉變控制模組55〇包括m個混合 器70a至70m之混合器組7〇〇。轉變控制模組550亦包括經組 態以產生轉變控制信號S60之滞留邏輯600。對於, 每一混合器70j經組態以根據轉變控制信號S60來混合經濾 波頻道S20jl至S20jn以產生相應輸出頻道S40-j。 圖22展示混合器70j之實施例72j的方塊圖(其中。 在此實例中’轉變控制信號S60並行地包括由混合器72j應 用以使各別經濾波頻道S20j 1至S20jn加權之η個值,且求和 〇 器6〇j計算經加權信號之和以產生輸出頻道S40-j。 圖23展示包括混合器組7〇〇之兩頻道實施例71〇之轉變控 制模組5 5 0之實施例5 5 5的方塊圖。在一此實例中,滯留邏 輯600之2頻道實施例61 〇經組態以計算在預定數目之訊框 (亦即,合併時間間隔)内自零至一變化之加權因數ω,且 輸出ω及(l-ω)之值(以由經估計狀態S5〇所判定之次序)作為 轉變控制信號60。混合器組71〇之混合器74a及74b各自經 組態以根據諸如下式之表達式來應用此等加權因數: 〇 ,其中Fn指示混合器正轉變至之經濾波頻 道’且Fc指示混合器正轉變自之經濾波頻道。 可能需要組態滯留邏輯600以針對經估計狀態S5〇之不同 轉變而應用不同延遲及/或合併時間間隔。舉例而言,經 估計狀態S50之一些轉變與其他轉變相比實務上可能較不 可能發生。相對較不可能之狀態轉變之一實例為指示使用 者已完全回轉手機之轉變(亦即,自主要麥克風面向使用 者之口的定向至主要麥克風面離使用者之口的定向可 137174.doc •32- 200939210 忐需要組態滯留邏輯600以針對較不可能之轉變而使用較 長延遲及/或合併週期。此組態可有助於抑制經估計狀態 指不S50之偽瞬變。亦可能需要組態滯留邏輯6〇〇以根據關 於通信器件之當前及/或先前狀態之其他資訊(諸如,如本 文中所論述之位置資訊、操作組態及/或操作模式)來選擇 延遲及/或合併時間間隔。 圖24展示裝置A21〇之實施例a218的方塊圖。在此實例 中,切換機構360之實施例368經組態以自n對經濾波頻道 〇 以及該對輸入頻道當中進行選擇以產生語音頻道S40-1及 雜訊頻道S40-2。在一實例中,切換機構368經組態成以雙 頻道模式或單頻道模式而操作。在雙頻道模式甲,切換機 構368經組態以自n對經濾波頻道當中進行選擇以產生語音 頻道S40-1及雜訊頻道S4〇_2。在單頻道模式中,切換機構 368經組態以選擇輸入頻道§ 1 〇_丨以產生語音頻道S4〇_ 1。 在單頻道模式之替代實施例中,切換機構368經組態以自 兩個輸入頻道當中進行選擇以產生語音頻道84〇_1。在此 © 狀況下,在兩個輸入頻道當中之選擇可基於一或多個準 則’諸如’最高SNR、最大語音似然性(例如,如由一或多 個統計度量所指示)、通信器件之當前操作組態,及/或判 定所要信號發源自之方向。 圖25展示裝置A220之相關實施例A228的方塊圖,其中 切換機構370之實施例378經組態以接收輸入頻道中之一者 (例如’與主要麥克風相關聯之頻道)且在處於單頻道模式 時輸出此頻道作為語音信號S40-1»切換機構可經組態以 I37174.doc -33· 200939210 在、里估汁疋向狀態不對應於濾波器組中之η個濾波器中的 任者時選擇單頻道模式。對於濾波器組120之兩濾波器 實施例130及如圖5所示之三重可能定向狀態而言,例如, 刀換機構可經組態以在經估計狀態s 5 〇對應於區域A]時選 擇單頻道模式。自設計觀點,單頻道模式可包括尚未發現 (或或者未預期)慮波器組中之渡波器中的任一者產生可靠 空間處理結果的狀況。舉例而言,切換機構可經組態以在 狀態估計器不能可靠地判定空間分離濾波器中之任一者已 〇 將所要聲音分量分離為相應經濾波頻道時選擇單頻道模 式。在一此實例中,比較器560經組態以指示針對分離量 測之間的差不超過最小值之狀況而選擇單頻道模式。 對於濾波器組100之所有濾波器皆係使用同一結構之各 別例項來實施的狀況’可能方便的係使用此結構之另一例 項來實施單頻道模式。圖26展示裝置Α228之此實施例 Α229的方塊圖。在此實例中,濾波器F14-1及F14-2係使用 同一濾波器結構之不同例項來實施,且透通濾波器f14_3 〇 係使用同一結構之經組態以在無任何空間處理之情況下傳 遞輸入頻道S10-1及S10-2的另一例項來實施。舉例而言, 濾波器組100之濾波器通常係使用交又濾波器前饋及/或反 饋結構來實施。在此狀況下,透通濾波器可使用所有交叉 滤波器之係數值皆為零之此結構來實施。在另一實例中, 透通遽波器F14-3經實施以阻斷輸入頻道s 1 0-2,使得僅傳 遞輸入頻道S1 0-1。裝置Α229亦包括切換機構378之實施例 379,其經組態成以與用於其他經濾波頻道S2011、 137174.doc -34- 200939210 2。 §2021及S2022之方式相同的方式而轉變至由透通 I皮器F14-3所產生之頻道及自由透通濾波器Fi4_3所產生 之頻C轉變(例如,基於經估計狀態指示。 ❹
不相關雜訊可使空間處理系統之效能降級。舉例而言, =相關雜訊之放大可在空間處理濾波器中歸因於白色雜訊 發生不相關雜訊對於少於麥克風或感測器中之全 '^的麥克風或感測器(例如,對於麥克風或感測器中之一 f)為特定的,且可包括歸因於風、到擦(例如,使用者之 心甲的到擦)、直接至麥克風中之啤吸或吹氣及/或感測器 或電路雜訊的雜訊。此雜訊傾向於尤其以低頻率顯現。可 能需要實施裝置A200以在傾測到不相關雜訊時關閉或繞過 空間㈣滤波器(例如,以轉至單頻道模式)及/或藉由高通 滤波器而自受影響之輸人頻道移除不相關雜訊。 圖27展示包括不相關雜訊偵測器3〇之裝置A2i〇之實施例 的方塊圖,不相關雜訊偵測器3 〇經組態以在輸入頻 道當中偵測為不相關之雜訊。不相關雜訊偵測器%可根據 2008年8月29日申請之名為”SYSTEMS,meth〇ds,謂〇
APPARATUS for detection of uncorrelated COMPONENT"之美國專利申請案第 12/201,528號中所揭示 之組態中的任-者來實施,料請案據此為了限於不相關 雜訊之偵測及/或對此偵測之回應之揭示的目的而以引用 之方式併入。纟此實例中,裝置A2l〇A包括切換機構⑽ 之實施例368A ’其經組態以在不相關雜訊偵測器3〇指示不 相關雜訊之存在(例如,經由可為二進位值之偵測指示 J37174.doc -35- 200939210 S80)時進入如上文所描 皁頻道模式。作為使用單頻道 模式之替代例(或除了使 早頻道模式以外),裝置Α21 〇Α 可經組態以在輸入頻道中之一 戈多者上使用可調整之高通 /慮波》。來移除不相關雜托,福ρ μ ^ _ . " 使仔僅在頻道中偵測到不相關 雜訊時啟動濾波器。 Ο
在用於話音通信(例如,電話)之收發器應用中,術語,,近 端"用以指示作為音訊而接收(例如,自麥克風)且由通信器 件所傳輸之信號,且術語,,遠端,,用以指示由通信器件所接 收^作為音訊而再現(例如’經由器件之-或多個擴音器) L號可月b需要回應於遠端信號活動性而修改裝置 之實施例的操作。尤其在全雙工揚聲器電話模式期間或在 頭戴式耳機中’例如,如由器件之擴音器所再現之遠端信 號活動性可由器件之麥克風拾取以顯現於輸人信號S10 上’且最終使定向狀態估計器分散。在此狀〉兄下可能需 要在遠端信號活動性之週期期間暫時中止對經估計狀態之 更新。圖28展示在遠端音訊信號S15(例如,如自通信器件 之接收器部分所接收)上包括話音活動性債測器(va d ) 2 〇之 例項70之裝置A224之實施例A224A的方塊圖。對於手機而 言,VAD 70可在全雙工揚聲器電話模式期間及/或在次要 揚聲器SP20為活動時經啟動,且其所產生之更新控制信號 S75可用以控制切換機構以在VAD指示遠端語音活動性時 去能對狀態估計器之輸出的改變。圖28展示切換機構374 之特定實施例374A,其經組態以在VAD 2〇及VAD 7〇中之 至少一者指示語音活動性時暫時中止經估計狀態S5〇之更 137174.doc -36· 200939210 ί於碩戴式耳機而言,VAD 7〇可在正常操作期間經啟 (例如,除非器件之主要揚聲器經消音)。 可鲍需要組態空間分離濾波器FiOq至Fl〇_n中之一或多 、處里具有少於Μ個頻道之信號。舉例而言,可能需要 組態空間分離濾波器中之—或多者(且可能全部)以僅處理 二對:入頻道(甚至對於Μ大於二之狀況而言)。此組態之 一可能原因將為使裝置A2GG之所得實施例容許Μ個麥克風 巾之-或多者的失效。另—可能原因為:在通信器件之一 ©些操作組態中,裝置Α2〇〇可經組態以停用或另外忽視_ 麥克風中之一或多者。 圖29及圖30展示裝置Α2〇〇之兩個實施例,其中Μ等於 三’且濾波器FU-!、F14_uF14_3中之每一者經組態以處 理一對輸入頻道。圖29展示裝置A232之方塊圖,其中濾波 器F14-1、F14-2及F14-3中之每一者經配置以處理三個輸入 頻道SHM、S10_2&sl〇_3之不同對。圖3〇展示裝置Μ” 之方塊圖,其中濾波器F14-1及F14-2經配置以處理輸入頻 © 道S10_l及S10-2,且濾波器Fi4-3經配置以處理輸入頻道 S10-1及S10-3。圖31展示裝置A200之實施例A236的方塊 圖’其中濾波器F14- 1至F 14-6中之每一者經組態以處理一 對輸入頻道。 在裝置Α234中,切換機構360可經組態以針對對應於輸 入頻道S1 0-3之麥克風經消音或為有故障之操作組態而選 擇濾波器F14-1及F14-2當中之一者’且否則選擇滅波器 F14-1及F 14-3當中之一者。對於在裝置Α236中選擇輸入頻 137174.doc -37- 200939210 道㈣-】至SHM之特定對(例如,基 應於與其他輸入頻道相關β ®則钿作組態,或回 言,切換機構360可經组/ ^麥克風之失效)的狀況而 道之滤波nF1W46r僅自對應於接收彼對輸入頻 的兩個狀態當中進行選擇。 在通信器件之某些操作捃彳+ '模式中,在三個或三個以上輪人 頻道當中選擇一對輸入頻、首了石丨 上輸入 、可至〉、部分地基於試探法來執 仃。在如圖2所描繪之習钒
電話槟式中,例如,通常以且 有有限可變性之受約击士 A ❹
又约束方式來固持電話,使得一對輸入頻 道之固定選擇可為充分的。 ^ 从及圖4B所描會之揚然而’在如圖3A及圖3B或圖 團所描繪之揚聲器電話令,許多固持型樣為可能 的’使得-對輸入頻道之動態選擇可能為需要的,以在所 有預期使用定向中獲得足夠分離。 在通信器件之使用壽命期間,麥克風元件中之一或多者 可能變得損壞或可能另外失效。如上文所註釋,可能需要 使裝置容許麥克風巾之—或多者的失效。切換機構 可藉由各自對應於輸入頻道之不同子集之多個狀態估 計方案來組態。舉例而言’可能需要提供針對各種預期故 障情境中之每—者(例如’針對每一可能故障情境)的狀態 估計邏輯。 可能需要實施狀態估計器4〇〇以藉由將指示符函數之值 映射至可能定向狀態集合而產生經估計狀態指示S50。在 裝置A200之兩濾波器實施例A220中,例如,可能需要將 分離量測壓縮成單一指示符且將彼指示符之值映射至可能 &向狀態集合中之相應定向狀態。一此方法包括計算每一 137174.doc -38- 200939210 遽波器之分離量測、借用!)且 J更用兩個量測來評估指千玆3 & β 將龙+忽:35叙位丄Α Τ俗子曰不符函數,及 將指不符函數值映射至可能狀態集合。 可使用任何分離量測,包 ▲八夕八缺I 上文參看圖】4A至圖14D所 响述之刀離量測(例如,能詈 此重差、相關、TDOA)。在一實 例中’濾波器組13 〇之各別处p弓八她、点丄 合列工間分離濾波器F14-l&F14-2 之分離量測Z丨及Z2中的每一去越斗曾*占 ㈣者經汁算為濾波器之輸出之能 量之間的差’其中每一艇;首夕Afc真 . 母頻道之犯量可經計算為在二十毫秒 §凡框上之平方樣本和:ζ 7 11 e'2 ' ,其中 en、
❹ 仏、仏、02分別表示頻道S2011、S2021、82012及32022 在相應訊框上之能量。指示符函數可接著經計算為兩個分 離量測之間的差,例如,Z1_Z2。 在評估指示符函數之前,可能需要根據相㈣波器輸入 頻道中之一或多者來按比例調整每一分離量測。舉例而 β,可能需要根據諸如以下表達式中之一者在相應訊框上 之值之和的因數來按比例調整量測Ζ丨及ζ2申之每一者: W ' k2卜h|+㈣、h+Al、丨邱2丨,其中、X2分別表示輸入頻道 S 10- 1 及 s 1 0-2之值。 可成需要針對分離量測而使用不同按比例調整因數。在 一此實例中,濾波器F1 4-1對應於所要聲音較多地引導於 對應於頻道S10-1之麥克風處的定向狀態,且濾波器F14-2 對應於所要聲音較多地引導於對應於頻道81〇_2之麥克風 處的定向狀態。在此狀況下,可能需要根據基於lx,丨在訊 框上之和的因數來按比例調整分離量測&,且根據基於|χ2| 在訊框上之和的因數來按比例調整分離量測Z2。在此實例 137174.doc -39- 200939210 中,分離量測Z'可根據諸如Z|=£gf之表達式來計算,且 分離量測^可根據諸如4=^1之表達式來計算。
可能需要使按比例調整因數在一方向上比在另一方向上 多地影響分離量測之值。在基於最大差之分離#測的狀況 下,例如,可能需要使按比例調整因數在輸入容量為低時 在不過度地增力口分離量測之值的情況下回應力高輸入頻道 容量而降低分離量測之值。(在基於最小差之分離量測的 狀況下,相反效應可為所要的。)在一此實例中,根據諸 如以下表達式之表達式來計算分離量測2丨及z β2 =max Ζ,=£ν^、,其中
V Is J 且八為臨限值。 圖32A展不將指示符函數值(例如,Ζι_ζ^映射至三個可 能定向狀態之集合的一實例。若值低於第一臨限值丁丨,則 選擇狀態!(對應於第一濾波器卜若值高於第二臨限值 T2 ’則選擇狀態3(對應於第二濾波器)。若值介於臨限值 © 之間貞彳選擇狀態2(不對應於任—濾波^,亦即,單頻道 模式)。在典型狀況下,臨限值丁丨與仞具有相反極性。圖 32B展不此映射之另一實例,其中不同臨限值LA、『IB及 T2A T2B用以視轉變正在進展之方向而控制狀態之間的 轉變此映射可用以降低歸因於定向之小改變的抖動及/ 或降低重疊區域中之不必要的狀態轉變。 如上文所論述之指示符函數方案亦可藉由(例如)以獲得 每一對頻道之選定狀態之方式來處理彼對且接著選擇總鱧 I37I74.doc -40· 200939210 具有最多表 道)實施例。 決之狀態而延伸至裝置Α200之三 頻道(或Μ頻 如上文所註釋,濾波器組130可經實施,使得渡波器 F14-2之係數值矩陣相對㈣波州^丨之相應係數值矩陣 而經翻轉。在,特严狀況下,如上文所論述之指示符函數 值可根據諸如γ之表達式來計算,其中&具有上文所 指示之值。
Ο 圖33Α展示組合裝置Α210與調適性濾波器45〇之裝置 Α200之實施例Α310的方塊圖,調適性漉波器45〇經組態以 執行輸出信號S40之額外空間處理(例如,語音分量與雜訊 分量之進一步分離)以產生另一輸出信號S42。可能需要實 施調適性濾波器450以包括複數個調適性濾波器,使得此 等組件濾波器中之每一者對應於濾波器組12〇中之濾波器 中的一者且根據經估計狀態指示S5〇而為可選擇的。舉例 而β調適性濾波器450之此實施例可包括類似於轉變控 制模組500之選擇或混合機構,其經組態以根據經估計^ 態指示S 5 0而選擇組件滤波器中之一者的輸出作為信號 S42,及/或在合併時間間隔期間混合組件濾波器中之兩者 或兩者以上的輸出以獲得信號S42。 調適性濾波器450(或其組件濾波器中之一或多者或可能 全部)可根據如本文中所描述之—或多個BSS、波束成形及/ 或經組合BSS/波束成形方法或根據適於特定應用之其他方 法來組態。可能需要藉由初始條件集合來組態調適性濾波 器450。舉例而言’可能需要使組件濾波器中之至少一者 137174.doc 41 200939210 具有非零初始狀態。此狀態可藉由將組件濾波器訓練至經 濾波信號上之收斂狀態而計算,該經濾波信號係藉由使用 濾波器組120中之相應濾波器以對訓練信號集合進行濾波 而獲得。在典型生產應用中,組件濾波器之參考例項及渡 波器組120之相應濾波器的參考例項用以產生接著儲存至 調適性濾波器450之組件濾波器的初始狀態(亦即,慮波器 係數之初始值集合)。初始條件之產生亦描述於2008年8月 25 日申請之名為"systEMS,METHODS,AND APPARATUS ❹ F0R SIGNAL SEPARATION"之美國專利申請案第12/197,924 號中的段落[00130]至[00134](以"For a configuration that includes"開始且以"during online operation"結束)處,該等 段落據此為了限於濾波器訓練之揭示的目的而以引用之方 式併入。下文亦更詳細地描述經由訓練而產生濾波器狀 態。 裝置八2〇〇亦可經實施以包括經配置以執行經空間處理信 號之頻譜處理的一或多個級。圖33B展示組合裝置A210與 ® 雜訊降低濾波器460之裝置A200之實施例A320的方塊圖。 雜訊降低濾波器460經組態以將雜訊頻道S40-2上之信號應 用為雜訊參考以降低語音信號S40-1中之雜訊且產生相應 經渡波語音信號S45。雜訊降低濾波器460可實施為維納 (Wlener)遽波器’其濾波器係數值係基於來自經分離頻道 之仏號功率資訊及雜訊功率資訊。在此狀況下,雜訊降低 遽波器460可經組態以基於雜訊參考(或對於輸出頻道S40 具有兩個以上頻道之更一般狀況而言基於一或多個雜訊參 137174.doc -42- 200939210 考)來估計雜訊頻譜。或者,雜訊降低濾波器460可經實施 以基於來自一或多個雜訊參考之頻譜而對語音信號執行頻 譜減去操作。或者,雜訊降低濾波器460可實施為卡爾曼 (Kalman)遽波器’其中雜訊協方差係基於一或多個雜訊參 考。 可能需要組態雜訊降低濾波器460以在僅非語音時間間 隔期間估計諸如頻譜及或協方差之雜訊特性。在此狀泥 下’雜訊降低濾波器460可經組態以包括話音活動性偵測 O (VAD)操作,或使用在裝置或器件内另外所執行之此操作 的結果,以在語音時間間隔期間去能雜訊特性之估計(或 者以僅在僅雜訊時間間隔期間賦能此估計)。圖3 3 展干 包括調適性濾波器450及雜訊降低濾波器46〇兩者之裝置 八310及八320之實施例A33〇的方塊圖。在此狀況下,雜訊 降低濾波器460經配置以將雜訊頻道342_2上之信號應用為 雜訊參考以降低語音信號S42-1中之雜印丨、;方Λ τ乏雜訊以產生經濾波語 音信號S45。
〜叩文肝冰衣直八2〇〇與器件 降低模組之實施例的任何其他雜訊降彼
、丞頻部分内)之間的可能互動。
137174.doc -43· 200939210 雜訊降低模組之預期雜訊輸入位準而可為過度主動的。視 保持於輸出信號S4〇中之雜訊之振幅及/或頻譜簽名而定, 單頻道雜訊降低模組可引入較多失真(例如,快速變化之 殘餘、音樂雜訊)。在此等狀況下,可能需要將一些經濾 波之舒適雜訊添加至輸出信號S40及/或回應於經組合雜訊 降低方案之輸出來調整一或多個參數設定。 Ο
G 單頻道雜訊降低方法通常要求獲取雜訊資料及話音資料 之某經延伸週期以提供用以支援雜訊降低操作之參考資 訊。此獲取週期傾向於在可觀測之雜訊移除中引入延遲。 與此等方法相此處所呈現之多頻道方法可歸因於使用 者之話音與背景雜訊之分離而提供相對瞬時的雜訊降低。 可此而要相對於單頻道雜崎低模組之動態特徵而 :佳化多頻道處理級之主動性設定之應用的時序。 可能需要回應於經估計狀態指示S50之改變而在後續處 魏中執行參數改變。亦可能需要使裝ΪΑ2⑽起始可與特 疋參數改變及/或經估計定向狀態相關聯之 滯留邏輯的改變。舉例而今,可妒愛 σ 了此需要在經估計狀態指示 之改變之後延遲主動後處理級歷時某週期,因為某一 經延伸估計週期可有助於確保狀態估計知識中之足夠信 賴。 0 虽疋向狀態改變時,春箭雜却安土 *刖雜讯參考可能不再適於後續空 間及/或頻譜處理操作, 變期間為h “ 且叮忐需要致使此等級在狀態轉 隻期π為較不主動的。盤如而 力絲㈤ 舉 S,可能需要使切換機構 350在轉變階段期間衰 取田別雜訊頻道輸出。滯留邏輯600 137174.doc •44· 200939210
可經實施以執行此操作。在一此實例中,滯留邏輯600經 組態以偵測當前經估計狀態與先前經估計狀態之間的不一 致性’且回應於此偵測而衰減當前雜訊頻道輸出(例如, 裝置A210之頻道S40-2)。可為平緩或即刻之此衰減可為實 質的(例如,在50%或60%至80%或90%之範圍内之量,諸 如,75%或80%)。至新語音及雜訊頻道中之轉變(例如, 皆以正常容量)亦可如本文中所描述而經執行(例如,參看 轉變控制模組550)。圖34展示在自頻道對S2011及S2012至 頻道對S2021及S2022之轉變期間此衰減方案之一實例的語 音頻道S2011、S2021及雜訊頻道S2012、S2022之隨時間的 相對增益位準。 亦可能需要根據經估計狀態指示S5〇來控制一或多個下 游操作《舉例而言,可能需要根據經估計狀態指示S5〇而 將相應初始條件集合應用至下游調適性濾波器(例如,如 圖33A及圖33C所示)。在此狀況下,可能需要如上文所描 述根據經估計㈣指示S5〇來選擇調適性遽波器州之^ 濾波器’且將、组件濾、波器重設至其初始狀態。纟自一初始 條件集合至另_初始條件集合或自—組件渡波器至另一乡且 件渡波器之轉變期間,可能需要以類似於上文參看滞留邏 輯00所拖述之方式的方式來衰減當前雜訊頻道
如,V a 。在裝置A200之單頻道操作期間,亦可能需要 去此諸如下游調適性^間處理據波器之器件(例如 33A至圖33c所示)的其他空間處理操作。 可遭遇系統雜訊降低效能相對於某些方向之某敏感性 137174.doc •45- 200939210 (例如’歸因於通信器件上之麥克風置放)。可能需要藉由 選擇適於特定應用之麥克風配置及/或藉由㈣雜訊時間 間&之選擇性遮蔽而降低此敏感性。此遮蔽可藉由選擇性 地衰減僅雜訊時間間隔(例如,使用如本文中所描述之 V A D )或藉由添加舒適雜訊㈣能後續單頻道雜訊降低模 組移除殘餘雜訊人為結果來達成。 _ 、
圖35A展示包括回音消除器EC1{)之裝置A細之實施例 A210B的方塊圖,回音消除器EC1()經組態以基於遠端音訊 信號S15來消除來自輸人信號S1Q之回音。在此實例中,回 音消除器沉1〇產i由璩波器組120作為輸入所#收之經消 除回音信號S1〇a。裝置A200亦可經實施以包括回音消除器 EC1〇之經組態以基於遠端音訊信號S15來消除來自輸出信 號S40之回音的例項。在任一狀況下,可能需要在通信器 件於揚聲器電話模式中之操作期間及/或在通信器件於 模式中之操作期間去能回音消除器Ec丨0。 圖B展示口曰消除器EC10之實施例EC12的方塊圖,實 施例EC12包括單頻道回音消除器EC2〇之兩個例項EC2〇a& EC20b。在此實例中,回音消除器EC2〇之每一例項經組態 以處理輸入頻道η、12之集合中的一輸入頻道以產生輸出 頻道〇1、02之集合中的一相應輸出頻道。回音消除器 EC20之各種例項可各自根據當前已知或仍待開發之任何回 音消除技術(例如,最小均方技術)而經組態。舉例而言, 回音消除論述於以上所提及之美國專利申請案第12/197,924 號之 & 落[00139]至[00141](以"An apparatus''開始且以 137174.doc •46- 200939210 B 5 00"結束)處,該專段落據此為了限於回音消除問題之 包括(但不限於)設計、實施及/或與裝置之其他元件之整合 的揭示之目的而以引用之方式併入。 圖3 5C展示回音消除器EC20之實施例EC22的方塊圖,實 施例EC22包括經配置以對遠端信號S丨5進行濾波之濾波器 C E1 0及經配置以組合經濾波遠端信號與經處理之輸入頻道 的加法器CE20。濾波器CE10之濾波器係數值可為固定及/ 或調適性的◎可能需要使用多頻道信號集合來訓練濾波器 〇 CE1 0之參考例項(例如,如下文更詳細地所描述),多頻道 "ίβ號係在通k器件再現遠端音訊信號時由通信器件之參考 例項記錄。 可能需要使裝置A210B之實施例駐留於通信器件内,使 得器件之其他元件(例如,行動台數據機(MSM)晶片或晶 片組之基頻部分)經配置以對輸出信號S4〇執行另外音訊處 理操作。在設計待包括於裝置A2〇〇之實施例中之回音消除 器時,可能需要考慮此回音消除器與通信器件之任何其他 ® 回音消除器(例如,MSM晶片或晶片組之回音消除模組)之 間的可能協同效應。 圖3 6展示在设計及使用包括如本文中所描述之裝置A200 之實施例(或如下文所描述之裝置A1〇〇)的器件期間可能遵 循之程序的流程圖。在設計階段,訓練資料用以判定固定 濾波器集合(例如,濾波器組100之濾波器的濾波器係數 值),且相應使用者手機狀態經特徵化以賦能當前定向狀 〜、之線上估„十(例如,藉由如本文中所描述之切換機構)及 137174.doc •47· 200939210 適於當前情形之固定濾波器集合之選擇。訓練資料為使用 通信器件之參考例項(例如,手機或頭戴式耳機)而在各種 使用者器件聲學情境下所記錄之吵雜語音樣本集合。在此 記錄(其可在無回音腔室中執行)之前,可能需要執行校準 以確保參考器件之Μ個麥克風之增益的比率(其可隨著頻率 而變化)係在所要範圍内。-旦已使用參考器件而判定固 定據波器集合’便可將固定濾波器集合複製至通信器件之 包括如本文中所描述之裝置之實施例的生產例項中。 ° 圖37展示設計方法觀之流㈣,設計方法ΜΗ)可用以 獲得特徵化濾波器組100之空間分離濾波器中之一或多者 的係數值。方法mo包括記錄多頻道訓練信號集合之任務 τιο及將訓練信號集合分為子集之任務τ2()。方法购亦包 括任務T30及τ40β對於子集中之每—者,任務T3〇將相應 空間分離滤波器訓練至收斂。任務Τ40評估經訓練慮波器 之分離效能。任務Τ20、Τ30及Τ40通常使用個人電腦或工 #站而在通信器件外部執行。方法Μ10之任務中之一或多 者可經反覆,直至在任務Τ40中獲得可接受結果為止。方 法Μ10之各種任務在下文進行更詳細地論述,且此等任務 之額外描述在2008年8月2S日申請之名為"systems, methods, and apparatus for signal separation- 的美國專利申請案第^97,924號中找到,該文獻據此為 了限於空間分離濾波器之設計、訓練及/或評估之目的以 引用之方式併入。 任務ΤΙ 〇使用至少尺個麥克風之陣列來記錄κ頻道訓練信 137174.doc -48· 200939210 藏集合,甘1 者…1 少等於Μ之整數。訓練信號中之每- . |及雜訊分量兩者,且在p個情境中之-者 下5己錄母一訓練信 之扛等於一,但通常為大於一 不同空間特徵Γ你丨‘ 母耆了 〇含 不同手機或職式耳機定向)及/或不 隹X 了能具有不冋性質之聲音源的俘獲)。 集合包括各自在Ρ個情境中之不同情境下所記錄 ❹ ❹ 之至少ρ個訓練信號,但此集合通常將包括針對每一情境 之多個訓練信號。 頻道訓練k號集合中之每一訓練信號係基於由Κ個麥 以之陣列回應於至少一資訊源及至少一干擾源而產生的 4 °可能需要(例如)使訓練信號中之每一者為語音在吵 雜環境中之記m個頻道中之每—者係基於〖個麥克風 中之相應麥克風的輸出。麥克風信號通常經取樣、可經 預處理(例如’針對回音消除、雜訊降低、頻譜成形等等 而經滤波),且可甚至經預分離(例如,藉由如本文中所描 述之另I間分離據波器或調適性據波器)。對於諸如語 音之聲學應用而言’典型取樣速率在自8册至16 kHZ之 範圍内。 有可能使用含有如本文中所描述之裝置A2G0之其他元件 的相同通信器件來執行任務Ti〇。然而,更通常而言,任 務TH)將使用通信器件之參考例項(例如,手機或頭戴式耳 機)來執行。藉由方法而產生之所得經收徵遽波器解答 集合將接著在生產鮮1載人至相^類㈣信器件之其他 I37174.doc -49· 200939210 例項中(例如,載入至每-此生產例項之快閃記憶體中)。 ❹ ❹ 在此狀況下,通信器件之參考例項(”參考器件,,)包括κ 個麥克風之陣列。可能需要使參考器件之麥克風具有與通 信器件之生產例項("生產器件")之聲學回應相同的聲學回 應。舉例而言,可能需要使參考器件之麥克風為與生產器 件之麥克風模型相同的模型’且以與生產器件之麥克風相 同的方式且在與生產器件之麥克風相同的位置中進行安 裝。此外,可能需要使參考器件另外具有與生產器件之聲 學特性相同的聲學特性。可能甚至需要使參考器件在聲學 方面與生產器件彼此等同。舉例而言,可能需要使參考器 件為與生產器件相同的器件模型。然而,在實際生產環境 中,參考器件可為在-或多個微小(亦即,在聲學方 重要)態樣中不同於生產器件之預生 紐IT心頂生產版本。在典型狀況 下,參考器件僅用於記錄訓練信號,使得可能沒有必要使 參考器件自身包括裝置A200之元件。 相同之K個麥克風可用以記錄所有訓練信號。或者,可 能需要使用以記錄訓練信號中之一者之〖個麥克風的集合 不同於(在麥克風之—或多者中)用以記錄訓練信號中之另 一者之κ個麥克風的集合。舉例而言,可能需要使用麥克 風陣列之不同例項/塞 J項以便產生對於麥克風當中之某程度之 變化為強健的複數個渡波器係數值。在一此狀況下κ頻 道訓練信號之集合包括❹參考器件之至少兩個不 所記錄的信號。 P個 一者包括至少一資訊源及至少一干擾 I37174.doc -50- 200939210 源通常,每一資訊源為再現語音信號或音樂信 器’且每-干擾源為再現干擾聲學信號(諸如,來::曰丨 預期環境之另-語音信號或周圍背景聲音)或雜訊信號^ 擴s器。可能使用之各種擴音器類型包括電動(例如j立 圈)揚聲器、壓電揚聲器、靜電揚聲器、帶式揚聲器 面磁性揚聲器,等等。在一情境或應用中充當資訊源之源 可在不同情境或應用中充當干擾源。在p個情境中之每一 者下屺錄來自K個麥克風之輸入資料可使用κ頻道磁帶記 〇錄器、具有κ頻道聲音記錄或俘獲能力之電腦或能夠同時 俘獲或另外記錄κ個麥克風之輸出的另一器件來執行(例 如’在約為取樣解析度内)。 聲學無回音腔室可用於記錄Κ頻道訓練信號集合。圖38 展示經組態以用於記錄訓練資料之聲學無回音腔室的實 例。在此實例中,頭部及軀幹模擬器(HATS,如由Bruel & Kjaer,Naerum,Denmark所製造)定位於向内聚焦式干擾源 陣列(亦即,四個擴音器)内。HATS頭部在聲學方面類似於 〇 «表性人類頭部,且在口中包括用於再現語音信號之擴音 器。干擾源陣列可經驅動以建立如圖所示封閉HATS之漫 射雜訊場。在一此實射,擴音器陣列經組態以在HATS 耳朵參考點或口參考點處播放處於75至78 dB之聲壓位準 的雜訊信號。在其他狀況下,一或多個此等干擾源可經驅 動以建立具有不同空間分布之雜訊場(例如,指向雜訊 場)。 可能使用之雜訊信號類型包括白色雜訊、粉色雜訊、灰 137174.doc -51 · 200939210 色雜訊及Hoth雜訊(例如,如由Institute of Electrical and
Electronics Engineers (IEEE),Piscataway,NJ所頒布之 IEEE 標準 269-2001 的"Draft Standard Methods for Measuring
Transmission Performance of Analog and Digital Telephone
Sets,Handsets and Headsets"中所描述可能使用之其他 雜訊信號類型包括褐色雜訊、藍色雜訊及紫色雜訊。 P個情境在至少一空間及/或頻譜特徵方面彼此不同。源 Ο 及麥克風之空間組態可以至少以下方式中之任何一或多者 而自一情境至另一情境變化:源相對於其他源之置放及/ 或定向、麥克風相對於其他麥克風之置放及/或定向、源 相對於麥克風之置放及/或定向,及麥克風相對於源之置 放及/或疋向。P個情境當中之至少兩者可對應於以不同空 間組態所配置之麥克風及源集合,使得集合當中之麥克風 或源中的至少_者在—情境下具有*同於其在另—情境下 置或定向的位置或定向。舉例而言,Ρ個情境當中之 :少兩者可關於攜帶型通信器件(諸如,具有Κ個麥克風之 陣列的手機哎瓸拼4, π W 兄凤之 Γ 對於諸如使用者之訊 括硬體約^如;?至另—情境不同之空間特徵可包 中使用型樣(例如,血二風在器件上之位置)、器件之計劃 同麥克風位置及//、t預期使用者持姿態),及/或不 風當中之不同=(例如,啟動三個或三個以上麥克 項:至少一源:另一情境變化之頻譜特徵包括至少以下各 ’、5唬之頻譜内容(例如,來自不同話音之笋 137174.doc -52- 200939210 g、不同顏色之雜訊)’及麥克風中之一或多者的頻率回 應。在如上文所提之-特定實例中,情境中之至少兩者相 對於麥克風中之至少-者不同(換言之,在一情境下所使 用之麥克風中的至少一者在另一情境下係由另一麥克風替 換或根本不使用)。此變化可能為需要的’以支援在頻率 之預期改變範圍及/或麥克風之相位回應上為強健的及/或 對於麥克風之失效為強健的解答。 在另-特定實例中’情境中之至少兩者包括背景雜訊且 © 相對於背景雜訊之簽名(亦即,雜訊在頻率及/或時間上之 統計)而不同。在此狀況下,干擾源可經組態以在p個情境 令之一者下發射一顏色(例如,白色、粉色或H〇th)或類型 (例如,街道雜訊、串音雜訊或汽車雜訊之再現)之雜訊, 且在P個情境中之另一者下發射另一顏色或類型之雜訊(例 如,在一情境下為串音雜訊,且在另一情境下為衔道及/ 或汽車雜訊)。 P個If境中之至少兩者可包括產生具有大體上不同頻譜 ° 内容之信號的資訊源。在語音應用中,例如,兩個不同情 境下之資訊信號可為諸如具有平均間距(亦即,在情境之 長度上)之兩個話音的不同話音,該等平均間距彼此相差 不小於10%、20%、30〇/〇或甚至50%。可自一情境至另一情 境變化之另一特徵為源相對於其他源之輸出振幅的輸出振 幅。可自一情境至另一情境變化之另一特徵為麥克風相對 於其他麥克風之增益敏感性的增益敏感性。 如下文所描述,K頻道訓練信號集合用於任務T3〇中以 137174.doc •53- 200939210 獲得經收斂據波器作赵 盜係數值集合。訓練信號中之每一者之持 =f pi可基於訓練操作之預期收斂速率來選擇。舉例而 口 ’可此需要針對每一訓練信號而選擇一持續時間,該持 續時間為足夠長以准許朝向收斂之顯著進展,但足夠短以 允許其他訓練6號亦A體上有助於經錢解答。在典型應 用中訓練彳5號中之每__者持續自約〇.5秒或—秒至約五 秒或十秒。對於典型訓練操作而言,訓練信號之複本以隨 ❹ ❹ 機-人序串聯以獲得待用於訓練之聲音檔案。訓練檔案之典 型長度包括 10、30、45、60、75、90、1〇〇及 120秒。 在近場情境下(例如’當通信器件靠近於使用者之口而 固持時),不同於遠場情境下(例如,當器件遠離於使用者 之口而固持時)之振幅及延遲關係的振幅及延遲關係可存 在於麥克風輸出之間。可能需要使P個情境之範圍包括近 場情境及遠場情境兩者。如下文所註釋,任務T30可經組 態以使用來自近場情境及遠場情境之訓練信號來訓練不同 濾波器。 對於Ρ個聲學情境中之每一者而言,資訊信號可藉由以 下操作而提供至κ個麥克風:自使用者之口再現人工語音 (如1993年3月Geneva, CH國際電信聯盟之ITU-T推薦Ρ. 50中 所描述)及/或發出諸如Harvard Sentence中之一或多者之標 準化"司彙的話音(如 1969 年 IEEE Recommended Practices for Speech Quality Measurements in IEEE Transactions on
Audio and Electroacoustics 第 17 卷第 227 至 246 頁中所描 述)。在一此實例中’自HATS之口擴音器以89 dB之聲壓位 137174.doc -54- 200939210
兄凤之回應變化為強健的經收斂解答)。 果&中,κ個麥克風為用於無線通信之攜 蜂巢式電話手機)的麥克風。圖1A及圖1B 菌不同組態,且圖2至圖4B展示此等組態 <態。兩個或兩個以上此等定向狀態可用 同者下。舉例而言,可能雪盘估κ相
於P個情境中之不同者下。 ’可能需要使K頻道訓 練信號中之一者基於由處於此等兩個定向中之一者之麥克 風所產生的信號,且使κ頻道訓練信號中之另一者基於由 處於此等兩個定向中之另—者之麥克風所產生的信號。 亦有可能針對器件之不同操作組態中之每一者而執行方 法Μ10之單獨例項(例如,以獲得每一組態之單獨經收斂濾 波器狀態集合)。在此狀況下,裝置Α2〇〇可經組態以在執 行時間在各種經收斂濾波器狀態集合當中(亦即,在濾波 器組1〇0之不同例項當中)進行選擇。舉例而言,裝置Α200 可經組態以選擇對應於開關之指示器件為打開還是閉合之 狀態的濾波器狀態集合。 在另一特定應用集合中,Κ個麥克風為有線或無線耳機 或其他頭戴式耳機之麥克風。圖9展示如本文中所描述之 此頭戴式耳機的一實例63。此頭戴式耳機之訓練情境可包 括如參看以上手機應用所描述之資訊源及/或干擾源的任 137174.doc -55- 200939210 何組合。可藉由P個訓練情境中之不同者而模型化之另一 差為傳感器軸線相對於耳朵之變化角度,如在圖9中由頭 戴式耳機安裝可變性66所指示。此變化實務上可自一使用 者至另一使用者發生。此變化相對於同一使用者在磨損器 件之單一週期上可相等。應理解,此變化可藉由改變自傳 感器陣列至使用者之口之方向及距離而不利地影響信號分 離效能。在此狀況下,可能需要使複數個κ頻道訓練信號 中之一者基於頭戴式耳機以處於或接近預期安裝角度範圍 © 之一極值的角度而安裝於耳朵65中的情境,且使Κ頻道訓 練仏號中之另一者基於頭戴式耳機以處於或接近預期安裝 角度範圍之另一極值的角度而安裝於耳朵65中的情境。ρ 個情境中之其他情境可包括對應於為此等極值之間的中間 值之角度的一或多個定向。 在另一應用集合中,Κ個麥克風為提供於免持汽車套組 中之麥克風。圖39展示此通信器件83之一實例,其中擴音 器85橫向地安置至麥克風陣列84。此器件之卩個聲學情境 可G括如參看以上手機應用所描述之資訊源及/或干擾源 的4何組β舉例而s,如圖所示,ρ個情境中之兩者 或兩者以上可在所要揚聲器相對於麥克風陣列之置放方面 不同p個情境t之—或多者亦可包括自擴音器85再現干 擾信號。不同情境可包括自擴音器85所再現之干擾信號, 諸如,在時間及/或頻率方面具有不同簽名(例如,大體上 不同間距頻率)之音樂及/或話音。在此狀況下,可能需要 使方法Ml 0產生分離干擾信號與所要語音信號之至少一濾 137174.doc -56- 200939210 波器狀態。p個情境中之一或多者亦可包括干擾,諸如, 如上文所描述之漫射或指向雜訊場。 在另應用集。中,K個麥克風為提供於筆、尖筆或立 他緣圖器件中之麥克風。圖41展示此器件79之一實例^ 中麥克風80相對於自尖端到達且由尖端與緣圖表面81之間 的接觸所引起之到擦雜訊82而以端射組態進行安置。此通 信器件之P個情境可句、,,+ 兄』L括如參看以上應用所描述之資訊源
G ❹ 及/或干擾源的任何組合。另外或在替代射,不同情境 可包括越過不同表面而拖,器件79之尖端以引出刮擦雜訊 82之不同例項(例如,纟時間及/或頻率方面具有不同簽 名)。與如上文所論述之手機或頭戴式耳機應用相比,可 能需要在此應用中使方法㈣產生分離干擾源(亦即,到擦 雜訊)而非資訊源(亦即,使用者之話音)之據波器狀態集 合。在此狀況下,經分離干擾可在稍後處理級中自所要信 號移除(例如,應用為如本文中所描述之雜訊參考卜 ^ 藉由方法Μ10而產生之經收斂濾波器解答集合的空間分 離特性⑽如,各種波束型樣之㈣及定向)可能對於在任 務丁1〇中用以獲取訓練信號之麥克風的相對特性為敏 的。可能需要在使用器#來記錄訓練信i集合之前至少校 準參考器件之K個麥克風相對於彼此的增益。亦可能需要 在生產期間及/或之後至少校準每一生產器件之麥克風相 對於彼此的增益。 即使個別麥克風元件在聲學方面經良好地特徵化,在諸 如元件安裝至通信器件採用之方式及聲學埠之品質之因素 137174.doc 57· 200939210 方面的差異可導致類似麥克風元件在實際使用中具有顯著 不同之頻率及增益回應型樣。因此,可能需要在麥克風陣 歹J已女裝於通>15器件中之後,執行麥克風陣列之此校準。 麥克風陣列之校準可在特殊雜訊場内執行,其中通信器 件、特火方式又向於彼雜訊場内。圖42展示兩麥克風手機 之實例,兩麥克風手機係置放於兩點源雜訊場中,使得兩 個麥克風(其中之每一者可為全向或單向的)皆同等地曝露 至同一SPL位準。可用以執行生產器件(例如,手機)之工 © 廠校準之其他校準外殼及程序的實例描述於2〇〇8年6月邛 曰申請之名為"SYSTEMS,METHODS,AND APPARATUS FOR CALIBRATION OF MULTI-MICROPHONE DEVICES" 的美國專利_請案第61/G77,144號中,該文獻據此為了限 於多重麥克風器件之校準的目的而以引用之方式併入。使 參考器件之麥克風之頻率回應與增益匹配可有助於在生產 期間校正聲學空穴及/或麥克風敏感性之波動,且亦可能 需要校準每一生產器件之麥克風。 〇 可能需要確保生產器件之麥克風與參考器件之麥克風使 用同一程序而經適當地校準。或者,可在生產期間使用不 同聲學校準程序。舉例而言,可能需要使用實驗室程序而 在房間大小之無回音腔室中校準參考器件,且在工廠地板 上在攜帶型腔室(例如,如上文所併入之美國專利申請案 第61/077,144號中所描述)中校準每一生產器件。對於在生 產期間執行聲學校準程序為不可行之狀況,可能需要組態 生產器件以執行自動增益匹配程序。此程序之實例描述於 137174.doc •58- 200939210 2008 年6月 2 日申請之名為,,SYSTEM aND METH〇d F〇R AUTOMATIC GAIN MATCHING OF A PAIR OF MICROPHONES" 的美國專利申請案第61/058,132號中,該文獻據此以限於 麥克風校準之技術及/或實施之描述的目的,以引用之方 式併入。 生產器件之麥克風之特性可隨時間而漂移。或者或另 外,此器件之陣列組態可隨時間而機械地改變。因此,可 能需要在通信器件内包括一校準常式,該校準常式經組態 〇 以在服務期間週期性地或在某其他事件(例如,使用者選 擇)後,便使一或多個麥克風頻率性質及/或敏感性(例如, 麥克風增益之間的比率)匹配。此程序之實例描述於如上 文所併入之美國臨時專利申請案第61/058,132號中。 p個情境中之-或多者可包括驅動通信器件之一或多個 擴音器(例如,藉由人工語音及/或發出標準化詞彙之話音) 以提供指向干擾源。包括一或多個此等情境可有助於支援 ㈣經收«波n解答對於來自遠料訊信狀干擾的強 健性。在此狀況下’可能需要使參考器件之擴音器為與生 產器件之擴音器模型相同的模型,且以與生產器件之擴音 器相同的方式且在與生產器件之擴音器相同的位置中進行 安裝。對於如圖1Α所示之操作組態而言,此情境可包括驅 動主^揚聲IISPH);而對於如_所示之操作組態而言,
此清&可包括驅動次要揚聲器sp2Q。除了(例如)由如圖W 所:之干擾源陣列所建立之漫射雜訊場以外或在該漫射雜 訊場之替代例中,情境可包括此干擾源。 I37I74.doc -59· 200939210 或者或另外,方法M10之例項可經執行以獲得如上文所 描述之回音消除器EC10之一或多個經收斂濾波器集合。對 於回音消除器在濾波器組100之上游的狀況,可在記錄濾 波器組100之訓練信號期間使用回音消除器之經訓練濾波 器。對於回音消除器在濾波器組100之下游的狀況,可在 記錄回音消除器之訓練信號期間使用濾波器組100之經訓 練濾波器。 雖然位於無回音腔室内之HATS被描述為用於在任務T10 © 中記錄訓練信號之合適測試器件,但任何其他具有人類特 點之模擬器或人類揚聲器可取代所要語音產生源。在此狀 況下,可能需要使用至少某量之背景雜訊(例如,以在所 要音訊頻率範圍上較好地調節濾波器係數矩陣)。亦有可 月b在使用生產器件之前及/或在使用生產器件期間對生產 器件執行測試。舉例而言,可基於通信器件之使用者之特 徵(諸如,麥克風至口之典型距離)及/或基於預期使用環境 來個人化測試。可針對使用者回應而設計一系列預設,,問 © 題’’’例如’其可有助於將系統調節至特定特徵、特質、 環境、使用,等等。 任務T20分類訓練信號集合中之每一者以獲得q個訓練 k號子集’其中Q為等於待在任務T3〇中訓練之渡波器之 數目的整數。分類可基於每一訓練信號之所有艮個頻道來 執行,或分類可限於少於每一訓練信號之所有κ個頻道的 頻道。對於Κ大於Μ之狀況,例如,可能需要使分類限於 每一訓練信號之Μ個頻道的同一集合(亦即,僅發源自陣列 137174.doc -60· 200939210 之用以記錄訓練信號之Μ個麥克風之特定集合的彼等頻 道)0 分類準則可包括先驗知識及/或試探法。在一此實例 中,任務Τ20基於記錄每一訓練信號所在之情境而將每一 麟信號指派至㈣子集。可能需要使任務頂將來自近 場If k之訓練信號分類為不同於來自遠場情境之訓練信號 的一或多個不同子集。在另一實例中,任務Τ2〇基於訓練 信號之兩個或兩個以上頻道之相對能量而將訓練信號指派 〇 至特定子集。
或者或另外’分類準則可包括藉由使用一或多個空間分 離遽波器來空間地處理訓練信號而獲得之結I此或此等 遽波器可根據藉由任務Τ30之先前反覆而產生之相應一或 *多個經收傲溏波器狀態而組態。或者或另夕卜一或多個此 等滤波器可根據如本文中所描述之波束成形或經組合刪 波束成形方法而組態。可能需要(例如)使任務Τ20基於發 現Q個空間分_波器中之哪—者產生信號之語音分量與 雜訊分量的最好分離(例如,根據如上文參看圖Μ至圖 14D所論述之準則)而分類每一訓練信號。 若任務Τ20不能將所有訓練信號分類為q個子集,則可 能需要增加Q之值。或者,可能需要在執行分類任務Τ20 覆之刖針對不同麥克風置放而重複記錄任務τ⑺ 以獲得新訓練信號集合、變更分類準則中之—或多者及/ 或選擇每—訓練信號之M個頻道的不同集合。任務T20可 使用個人電腦或工作站而在參考器件内執行,但通常在通 137174.doc -61 - 200939210 信器件外部執行。 任務T30根據各別源分 — 離决算法而使用Q個訓練子集中 之每一者來訓練相應調通 過性濾波結構(亦即,以計算相 應經收斂遽波器解答)。⑽濾波器結構中之每-者可包括 乂饋及/或反饋係數,且可為有限脈衝回應(fir)或無限脈 衝回應(IIR) 6又计。此等據波器結構之實例描述於如上文所 併入之美國專财請㈣12/197,924號卜任務咖可使用 個人電腦或工作站而在參考器件内執行,但通常在通信器 ❹ 件外部執行。 術語"源分離演算法"包括諸如獨立分量分析(ICA)之盲 源分離演算法及諸如獨立向量分析(IVA)之相關方法。盲 源分離(BSS)演算法為僅基於源信號之混合物來分離個別 源信號(其可包括來自一或多個資訊源及一或多個干擾源 之信號)的方法。術語"盲"指代參考信號或所關注信號為不 可用之事實’且此等方法通常包括關於資訊及/或干擾信 號中之一或多者之統計的假設。在語音應用中,例如,通 ® 常假設所關注語音信號具有超高斯分布(例如,高峰度)。 典型源分離演算法經組態以處理經混合信號集合以產生 經分離頻道集合,經分離頻道包括(A)具有信號及雜訊兩 者之組合頻道及(B)至少一雜訊佔優勢之頻道。組合頻道 與輸入頻道相比亦可具有增加之信雜比(SNR)。可能需要 使任務T30產生經收斂濾波器結構,經收斂濾波器結構經 組態以對具有指向分量之輸入信號進行濾波,使得在所得輸 出信號中,指向分量之能量集中至輸出頻道中之一者中。 137174.doc • 62 · 200939210 BSS演算法類別包括多變數盲解卷積演算法。源分離演 算法亦包括BSS演算法之變型(諸如,ICA及IVA),該等變 5•根據諸如源信號中之一或多I中之每一者相對於(例如) 麥克風陣列之軸線的已知方向之其他先驗資訊而受約束。 可僅基於指向資訊且不基於所觀測信號而區分此等演算法 與應用固定非調適性解答之波束成形器。 如本文中所註釋,濾波器組1〇〇之空間分離濾波器及/或 調適性濾波器450之空間分離濾波器中的每一者可使用 Bss、波束成形或經組合BSS/波束成形方法來建構。bss
方法可包括實施ICA、IVA、受約束ICA或受約束IVA中之 至少一者。獨立分量分析為用於分離彼此大概獨立之經混 合源信號(分量)的技術。在其簡化形式中,獨立分量分析 對經混合信號操作,,未混合"加#矩陣(例如,使矩陣與經混 合信號相乘)以產生經分離信號。向加權指派初始值,且 接著對其進行調整以最大化信號之聯合熵,以便最小化資 訊冗餘。重複此加權調整及熵增加過程,直至將信號之資 訊冗餘降低至最小值為止。諸如ICA之方法提供用於分離 語音信號與雜訊源之相對精確且靈活的方<。獨立向量分 析("IVA")為相關技術’其中源信號為向量源信號而非單一 可變源信號。因為此等技術不需要關於每一信號之源的資 訊,所U其被稱為·•盲源、分離"方&。盲源分離問題指代分 離來自多個獨立源之經混合信號的觀念。 Q個空間分㈣波n(例如,錢hLq個空間分 離渡波器或調適性渡波器450之q個空間分離渡波器)中之 I37174.doc • 63 - 200939210 每一者係基於相應調適性濾波器結構,其係數值係使用自 源分離演算法所導出之學習規則而藉由任務T30來計算。 圖43A展示包括兩個反饋濾波器ci 10及C120之調適性濾波 器結構FS10之兩頻道實例的方塊圖,且圖43B展示亦包括 兩個直接濾波器D110及]:>120之濾波器結構FS10之實施例 FS20的方塊圖。由任務T30用以訓練此結構之學習規則可 經設計以最大化濾波器之輸出頻道之間的資訊(例如,以 最大化由濾波器之輸出頻道中之至少一者所含有的資訊 φ 量)。此準則亦可隨著最大化輸出頻道之統計獨立性或最 小化輸出頻道當中之相互資訊或最大化輸出處之熵而被重 申。可能使用之不同學習規則之特定實例包括最大資訊 (亦被稱為infomax)、最大似然性及最大非高斯性(例如, 最大峰度)。此等調適性結構及基於ICA或IVA調適性反饋 及前饋方案之學習規則的其他實例描述於以下文獻中: 2006年 3月 9 日公開之名為"System and Method for Speech Processing using Independent Component Analysis under © Stability Constraints"的美國公開專利申請案第 2006/0053002 A1 號;2006 年 3月 1 日申請之名為"System and Method for Improved Signal Separation using a Blind Signal Source Process”的美國臨時申請案第60/777,920號;2006年3月1曰 申請之名為"System and Method for Generating a Separated Signal”的美國臨時申請案第60/777,900號;及名為"Systems and Methods for Blind Source Signal Separation"之國際專利公 開案WO 2007/100330 A1 (Kim等人)。調適性濾波器結構及 137174. doc -64- 200939210 可在任務T30中用以訓練此等濾波器結構之學習規則的額 外描述可在如上文以引用之方式併入的美國專利申請案第 12/197,924號中找到。 Q個濾波器中之一或多者(可能全部)可基於同一調適性 結構’其中每一此濾波器係根據不同學習規則來訓練。或 者’ Q個濾波器中之全部可基於不同調適性濾波器結構。 可用以訓練如圖43 A所示之反饋結構FS10之學習規則的一 實例可表達如下:
Jl(0 =^(〇 + (^2(〇<81^2(〇) (1) 少2(,) (2) Ο) ^h\k = -f(y2(())xy\(t-k) (4) 〇 ❹ 其中ί表示時間樣本索引,心2⑺表示濾波器cu〇在時間广之 係數值,表示濾波器C120在時間丨之係數值,符號⑭ 表示時域卷積運算,表示濾波器cu〇在計算輸出值 少丨⑴及乃⑴之後的第k係數值之改變,且Δ/ί2ι4表示濾波器 C120在計算輸出值力⑺及乃⑺之後的第數值之改變。 可能需要實施啟動函數/作為近似所要信號之累積密度函 數的非線性有界函數。可用於語音應用之啟動信號/之非 線性有界函數的實例包括雙曲線正切函數、s型函數及符 號函數。 ICA及IVA技術允許調適濾波器以解決極複雜之情境, 但並非-直有可能或需要實施經組態卩即時地調適之用於 信號分離過程的此等技術。第-,為調適所需要之收斂時 137174.doc -65- 200939210 間及指令的數目對於-些應用可為禁止性的。雖然以良好 初始條件之形式的先驗訓練知識之併入可加速收斂,但在 一些應用中,調適不為必要的,或僅對於聲學情境之一部 分為必要的。第二’若輸入頻道之數目為大的,則iva學 習規則可非常緩慢地收斂且在局部最小值中變得卡塞。第 三,IVA之線上調適之計算成本可為禁止性的。最後,調 適性據波可與可由使用者錢為額外㈣或㈣於安裝於
Ο 處理方案之下游之語音辨識系統㈣變及調適性增益調變 相關聯。 可用於線性麥克風陣列處理之另—技術類別通常被稱為 ”波束成形"。波束成形技術使用頻道之間由麥克風之*門 :集所引起之時間差來加強自特定方向到達之信號:分 量。更特定而t,麥克風中之一者很可能將更直接定向於 所要源(例如’使用者之口)處,而另-麥克風可產生經相 #咸之來自此源的彳5號。此等波束成形技術為空間滤波 方法,其操縱波束朝向聲音源,此在其他方向處放置空 值。波束成形技術不進行關於聲音源之假設,但為了使信 號解展響或局部化聲音源之目的而假設源與感測器之間的 幾何形狀或聲音作·#白i β唬自身為已知的。濾波器組100之濾波 器中之-或多者可根據資料依賴性或資料獨立性波束成形 器設計(例如’超指向性波束成形器、最小平方波束成形 器或料最佳波束成形器設計)而組態。在資料獨立性波 束成=器設計之狀況下,可能需要使波束型樣成形以覆蓋 所要二間區域(例如,藉由調tt雜訊相關矩陣)。 137174.doc -66 - 200939210 被稱為”通用化旁瓣消除(Generalized Sidelobe Canceling)" (GSC)之強健調適性波束成形中的經良好研究之技術論述 於 1999年 10月 IEEE Transactions on Signal Processing第 47 卷第 10號第 2677至 2684 頁之 Hoshuyama,0.,Sugiyama,A., Hirano,A.的 A Robust Adaptive Beamformer for Microphone Arrays with a Blocking Matrix using Constrained Adaptive Filters中。通用化旁瓣消除旨在自量測集合濾出單一所要 源信號。GSC原理之更完整解釋可在(例如)1982年1月IEEE ❹ Transactions on Antennas and Propagation第 30卷第 1 號第 27 至 34 頁之 Griffiths,L.J.、Jim,C.W.的 An alternative approach to linear constrained adaptive beamforming 中找 到。 對於Q個訓練子集中之每一者而言,任務T30根據學習 規則而將各別調適性濾波器結構訓練至收斂。回應於訓練 子集之信號來更新濾波器係數值可繼續,直至獲得經收斂 解答為止。在此操作期間,訓練子集之信號中之至少一些 〇 可可能以不同次序而經提交一次以上以作為至濾波器結構 之輸入。舉例而言,訓練子集可在一迴路中經重複,直至 獲得經收斂解答為止。收斂可基於濾波器係數值來判定。 舉例而言,當濾波器係數值不再改變時或當濾波器係數值 在某時間間隔上之總改變小於(或者,不大於)臨限值時, 可決定濾波器已收斂。亦可藉由評估相關量測而監視收 斂。對於包括交叉濾波器之濾波器結構而言,可針對每一 交又濾波器而獨立地判定收斂,使得用於一交叉濾波器之 137174.doc -67- 200939210 更新操作可終止,而用於另一交又濾波器之更新操作繼 續或者,每一交又濾波器之更新可繼續,直至所有交又 濾波器已收斂為止。 濾波器將有可能在任務T3〇中收斂至局部最小值,從而 在任務Τ40中針對相應評估集合中之信號中的一或多者(可 能全部)而導致彼濾波器之失效。在此狀況下,可使用不 同訓練參數(例如,不同學習速率、不同幾何約束,等等) 至夕針對彼濾波器而重複任務Τ3 0。 ® 任務T4G藉由評估每—m之分離效能而評估在任務 T30中所產生之q個經訓練濾波器的集合。舉例而言,任 務T40可經組態以評估濾波器對一或多個評估信號集合之 回應。此評估可自動地及/或藉由人類監督而執行。任務 T40通常使用個人電腦或工作站而在通信器件外部執行。 任務T 4 0可經組態以獲得每一滤波器對同一評估信號集 合之回應。此評估信號集合可與在任務T3〇中所使用之訓 、練集合相同。在一此實例中,任務Τ4〇獲得每一濾波器對 訓練信號中之每一者的回應。或者,評估信號集合可為不 同於但類似於訓練集合之信號(例如,使用同一麥克風陣 列之至少—部分及相同Ρ個情境中之至少-些而記錄)的Μ 頻道信號集合。 任務Τ40之不同實施例經組態以獲得〇個經训練濾波器 中之至少兩者(且可能全部)對不同各別評估信號集合的回 應。每一濾波器之評估集合可與在任務丁 3〇中所使用之訓 練子集相同。在-此實例中,任務Τ4〇獲得每一遽波器對 137174.doc -68- 200939210 其各別訓練子集中之信號中每一 考的回應。或者,每一 砰估信號集合可為不同於但類似 m 々曰您训練子集之信號 (例如’使用同一麥克風陣列 部分及相同情境中 至夕一或多者而記錄)的1;1頻道信號集合。 任:㈣可經組態以根據一或多個度;之值來評估遽波 °回應。對於每一渡波器回應而言,例如,任務T40可經 :態以計算-或多個度量中之每—者的值且比較經計算值 與各別臨限值。 〇 可用以評估濾波器之度量之一實例為以下兩者之間的相 關:⑷評估信號之原始資訊分量(例如,自聰8之口擴音 器所再現之語音信號)’及(B)m對彼評估信號之回應 的至少-頻道此度量可指示經收傲m結構如何良好 地分離資訊與干擾。在此狀況下,當資訊分量大體上與遽 波器回應之Μ個頻道t之—者相關且具有與其他頻道之小 相關時,指示分離。 可用以評估據波器(例如’以指示濾、波器如何良好地分 離資訊與干擾)之度量之其他實例包括諸如方差、高斯性 及/或較向階統計矩(諸如,峰度)之統計性質。可用於語音 k號之度量之額外實f列包括零點&又速率及隨時間之叢發 性(亦被稱為時間稀疏性)。—般而纟,語音㈣與雜訊信 號相比展現較低零點交又速率及較低時間稀疏性。可用以 砰估濾波器之度量之另一實例為如藉由濾波器對評估信號 之回應所指示之在記錄彼評估信號期間資訊或干擾源相對 於麥克風陣列之實際位置與波束型樣(或空值波束型樣)相 137174.doc •69· 200939210 符合的程度。可能需要使在任務T40中所使用之度量包括 或限於在裝置A200之相應實施例中所使用之分離量測(例 如’上文參看狀態估計器402、404、406、408及414論述 之分離量測中的一或多者)。 任務T40可經組態以比較每一經計算度量值與相應臨限 值。在此狀況下’若每一度量之經計算值高於(或者,至 少等於)各別臨限值,則濾波器可被稱為產生信號之充分 分離結果。一般熟習此項技術者將認識到,在用於多個度 〇 量之此比較方案中,當一或多個其他度量之經計算值為高 時,可降低一度量之臨限值。 任務T40可經組態以驗證到,對於每一評估信號而言, Q個經訓練濾波器中之至少一者產生充分分離結果。舉例 而言’任務T40可經組態以驗證到,Q個經訓練濾波器中 之每一者提供針對其各別評估集合中之每一信號的充分分 離結果。 或者’任務T40可經組態以驗證到,對於評估信號集合 中之每一信號而言,Q個經訓練濾波器中之一適當經訓練 慮波器提供所有Q個經訓練濾波器當中之最好分離效能。 舉例而言’任務T40可經組態以驗證到,Q個經訓練濾波 器中之每一者針對其各別評估信號集合中之所有信號而提 供所有Q個經訓練濾波器當中之最好分離效能。對於評估 信號集合與訓練信號集合相同的狀況,任務T40可經組態 以驗證到’對於每一評估信號而言,使用彼信號而訓練之 渡波器產生最好分離結果。 137174.doc 200939210 任務T40亦可經組態以藉由使用狀態估計器4〇〇(例如, 待用於生產器件中之狀態估計器4〇〇的實施例)來評估遽波 器回應以將其分類。在一此實例中,任務T4〇獲得Q個經 訓練濾波器中之每一者對訓練信號集合中之每一者的回 應。對於此等訓練信號中之每一者而言,所得Q個濾波器 回應提供至狀態估計器400,狀態估計器4〇〇指示相應定向 狀態。任務Τ40判定所得定向狀態集合與來自任務Τ2〇之相 應訓練信號之分類是否匹配(或所得定向狀態集合與來自 Ο 任務Τ20之相應訓練信號之分類如何良好地匹配)。 任務Τ40可經組態以改變經訓練濾波器之數目Q的值。 舉例而言’任務Τ40可經組態以在q個經訓練濾波器中之 一者以上產生充分分離結果所針對之評估信號之數目(或 比例)高於(或者’至少等於)臨限值時降低Q之值。或者或 另外’任務Τ40可經組態以在發現不充分分離效能所針對 之評估信號之數目(或比例)高於(或者,至少等於)臨限值 時增加Q之值。 © 任務Τ40將有可能僅對於評估信號中之一些失效,且可 能需要保持相應經訓練濾波器適於任務Τ4〇通過所針對之 複數個評估信號。在此狀況下,可能需要重複方法Μ1〇以 獲得其他評估信號之解答。或者,任務Τ40失效所針對之 信號可作為特殊狀況而被忽略。 可能需要使任務Τ40驗證到經收斂濾波器解答集合遵守 其他效能準則,諸如’如在諸如ΤΙΑ-81〇-Β(例如,2006年 11月之版本,如由Telecommunicati〇ns Industry Ass〇ciati〇n, 137174.doc -71- 200939210
Arlington,VA所頒布)之標準文獻中所指定之發送回應標稱 響度曲線。 方法Ml 0通常為反覆設計過程,且可能需要改變及重複 任務T10、T20、T30及T40中之一或多者,直至在任務T4〇 中獲得所要評估結果為止。舉例而言,方法Ml〇之反覆可 包括在任務Τ30中使用新訓練參數、在任務Τ3〇中使用新分 段’及/或在任務Τ1 0中記錄新訓練資料。 有可能使參考器件具有多於生產器件之麥克風的麥克 © 風。舉例而言,參考器件可具有Κ個麥克風之陣列,而每 生產器件具有Μ個麥克風之陣列。可能需要選擇一麥克 風置放(或Κ頻道麥克風陣列之子集),使得最小數目之固 定濾波器集合可適當地分離訓練信號與最大數目之使用者 器件固持型樣集合(或至少使用者器件固持型樣集合當中 之最普通集合)。在一此實例中,任務Τ40選擇Μ個頻道之 子集以用於任務Τ30之下一反覆。 一旦在任務Τ40已獲得Q個經訓練濾波器之集合的所要 ® 評估結果,便可將彼等濾波器狀態載入至生產器件中作為 濾波器組100之濾波器的固定狀態。如上文所描述,亦可 能需要執行用以校準每一生產器件中之麥克風之增益及/ 或頻率回應的程序’諸如,實驗室、工廠或自動(例如, 自動增益匹配)校準程序。 在方法Μ10中所產生之Q個經訓練濾波器亦可用以對亦 使用參考器件而記錄之另一訓練信號集合進行濾波,以便 5十算調適性濾波器450之初始條件(例如,對於調適性渡波 137174.doc •72· 200939210 器450之一或多個組件濾波器)。調適性濾波器之初始條件 之此計算的實例描述於2008年8月25日申請之名為 "SYSTEMS, METHODS, AND APPARATUS FOR SIGNAL SEPARATION”之美國專利申請案第12/197,924號中的(例 如)段落[00129]至[00135](以"It may be desirable"開始且以 "cancellation in parallel"結束)處,該等段落據此為了限於 調適性濾波器之設計、訓練及/或實施之描述的目的而以 引用之方式併入。此等初始條件亦可在生產期間載入至相 Ο 同或類似器件之其他例項中(例如,就濾波器組1 〇〇之經訓 練濾波器而論)。類似地,方法Ml0之例項可經執行以獲得 下文所描述之濾波器組200之濾波器的經收斂濾波器狀 態。 如上文所描述之裝置A200之實施例使用單一濾波器組以 用於狀態估計且用於產生輸出信號S40。可能需要將不同 遽波器組用於狀態估計及輸出產生。舉例而言,可能需要 將連續地執行之較不複雜濾波器用於狀態估計濾波器組, 且將僅按需要執行之較複雜濾波器用於輸出產生濾波器 組。此方法可在一些應用中及/或根據一些效能準則而以 較低功率成本來提供較好空間處理效能。一般熟習此項技 術·者亦將認識到,濾波器之此選擇性啟動亦可經應用以支 援在不同時間使用相同濾波器結構作為不同濾波器(例 如’藉由載入不同濾波器係數值集合)。 圖44展示根據一通用組態之裝置A1〇〇的方塊圖,裝置 A100包括如本文中所描述之濾波器組1〇〇(每一濾波器Fi〇_ 137I74.doc •73- 200939210 1至F 1 0-n經組態以產生!^固M頻道經空間處理信號S2〇_ ι至 S20-n中之一相應信號)及輸出產生濾波器組2〇〇。濾波器 組200之濾波器F2〇-1至F20-n中之每一者(其可在如上文所 描述之設計程序中結合濾波器組i 〇〇之濾波器而被獲得)經 配置以接收及處理基於輸入信號S10之Μ頻道信號且產生1;1 頻道經空間處理信號S30-1至S30-n中之一相應信號。切換 機構300經組態以判定哪一濾波器ριο」至Fi〇_n當前最好 地分離輸入信號S10之所要分量與雜訊分量(例如,如本文 Ο 中參看狀態估計器400所描述),且基於信號S30-1至S30-n 中之至少一相應選定信號而產生輸出信號S4〇(例如,如本 文中參看轉變控制模組500所描述)^切換機構3 〇〇亦可經 組態以選擇性地啟動濾波器F20-1至F20-n中之個別遽波 器’使得(例如)僅輸出當前正有助於輸出信號S40之濾波 器當前為活動。因此’在任一時間,濾波器組2〇〇可能正 輸出小於信號S30-1至S30-n中之η個(且可能僅一或兩個)。 圖45展示裝置Α100之實施例Α110的方塊圖,實施例 © Α110包括濾波器組1〇〇之兩濾波器實施例ι4〇及濾波器組 200之兩濾波器實施例240,使得濾波器組240之濾波器 F26-1對應於濾波器組140之濾波器F 1 6-1,且濾波器組240 之滤波器F26-2對應於遽波器組140之濾波器F 16-2。可能 需要將濾波器組240之每一濾波器實施為濾波器組14〇之相 應濾波器的較長或另外較複雜版本,且可能需要使此等相 應滅、波器之空間處理區域(例如,如圖5及圖6Α至圖6C之圖 解所示)至少大約重合。 137l74.doc -74- 200939210 裝置A110亦包括切換機構300之實施例3〇5,其具有狀態 估計器400之實施例420及轉變控制模組5〇〇之兩濾波器實 施例5 10。在此特定實例中,狀態估計器42〇經組態以將控 制信號S90之例項S90-1至S90-2中之一相應例項輸出至遽 波器組240之每一濾波器以僅按需要而賦能濾波器。舉例 而言,狀態估計器420可經組態以產生控制信號S90之每一 例項(其通常為二進位值的)以(A)在經估計狀態S50指示對 應於相應濾波器之定向狀態時的週期期間及在轉變控 Ο 制模組51〇經組態以轉變至彼濾波器之輸出或轉變成遠離 於彼濾波器之輸出時的合併時間間隔期間賦能彼濾波器。 狀態估計器420可因此經組態以基於諸如以下各項之資訊 而產生每一控制信號:當前及先前經估計狀態、關聯延遲 及合併時間間隔,及/或濾波器組200之相應濾波器的長 度。 圖46展示裝置A100之實施例A120的方塊圖,實施例 A120包括濾波器組1〇〇之兩濾波器實施例150及濾波器組 ❹ 20〇之兩濾波器實施例250,使得濾波器組250之渡波器 F28-1對應於濾波器組150之濾波器F18-1,且濾波器組25〇 之濾波器F28-2對應於濾波器組150之濾波器F18-2。在此 狀況下’在兩個級中執行濾波,其中第二級之濾波器(亦 即’濾波器組250之濾波器)僅按需要而經賦能(例如,在如 上文所描述選擇彼濾波器及轉變至彼濾波器之輸出或轉變 成遠離於彼濾波器之輸出期間)。濾波器組亦可經實施, 使得遽波器組1 5 0之滤波器為固定的’且濾' 波器組2 5 〇之濾 137174.doc -75- 200939210 波器為調適性的。然而,可能需要實施濾波器組25〇之濾 波器,使得每一兩級濾波器之空間處理區域(例如,如圖5 及圖6A至圖6C之圖解所示)至少大約與濾波器組1〇〇之濾波 器之相應濾波器的空間處理區域重合。一般熟習此項技術 者將認識到,對於本文中揭示裝置A2〇〇之實施例之使用的 任何情形而言’可執行裝置A1 〇〇之類似實施例的取代,且 明確地預料且據此揭示所有此等組合及配置。 圖47展示處理包括語音分量及雜訊分量之μ頻道輸入信 〇 號以產生經空間濾波輸出信號之方法Μ1 00的流程圖。方 法Μ1 00包括將第一空間處理濾波器應用至輸入信號之任 務Τ110,及將第二空間處理遽波器應用至輸入信號之任務 Τ120。方法Μ100亦包括任務Τ130及Τ140 »在第一時間, 任務Τ130判定第一空間處理濾波器優於第二空間處理濾波 器而分離語音分量與雜訊分量。回應於此判定,任務Τΐ4〇 產生基於第一經空間處理信號之信號作為經空間濾波輸出 信號。方法M100亦包括任務Tl50及τ16oβ在第一時間之 © 後的第二時間,任務Τ1 50判定第二空間處理濾波器優於第 一空間處理濾、波器而分離語音分量與雜訊分量。回應於此 判定’任務Τ1 60產生基於第二經空間處理信號之信號作為 經空間濾波輸出信號。在此方法中,第一經空間處理信號 及第二經空間處理信號係基於輸入信號。 如上文所描述之裝置Α100可用以執行方法Μ1〇〇之實施 例。在此狀況下,在任務Τ110及Τ120中所應用之第一空間 處理濾波器與第二空間處理濾波器為濾波器組1〇〇之兩個 137174.doc -76- 200939210 不同濾波器。切換機構300可用以執行任務T13〇及T14〇 , 使得第一經空間處理信號為濾波器組2〇〇之對應於濾波器 組100之在任務T110中所應用之濾波器的濾波器之輸出。 切換機構300亦可用以執行任務τ〗5〇及τ 1 6〇,使得第二經 空間處理信號為濾波器組200之對應於濾波器組i 〇〇之在任 務T120中所應用之濾波器的濾波器之輸出。 如上文所描述之裝置A200可用以執行方法M1〇〇之實施 例。在此狀況下,濾波器組1 〇〇之在任務τ丨丨〇中所使用之 © 濾波器亦產生任務T140中之輸出信號所基於的第一經空間 處理信號,且濾波器組1〇〇之在任務丁12〇中所使用之濾波 器亦產生任務T160中之輸出信號所基於的第二經空間處理 信號。 圖48展示用於處理包括語音分量及雜訊分量之M頻道輸 入k號以產生經空間濾波輸出信號之裝置F丨〇〇的方塊圖。 裝置F1 00包括用於對輸入信號執行第一空間處理操作的構 件F11 0,及用於對輸入信號執行第二空間處理操作的構件 〇 F120(例如,如上文參看濾波器組1〇〇及任務丁11〇及丁12〇所 描述)。裝置F100亦包括用於在第一時間判定用於執行第 一空間處理操作之構件優於用於執行第二空間處理操作之 構件而分離語音分量與雜訊分量的構件F13〇(例如,如上 文參看狀態估計器400及任務T130所描述),及用於回應於 此判定而產生基於第一經空間處理信號之信號作為輸出信 號的構件F140(例如,如上文參看轉變控制模組5〇〇及任務 T140所描述)。裝置F100亦包括用於在第一時間之後的第 137174.doc •77· 200939210 二時間判定用於勃/_ —和 ;執行第二空間處理操作之構件優於用於執 〗處理操作之構件而分離語音分量與雜訊分量的 構件F150(例如,1 L Λ > 如上文參看狀態估計器400及任務ΤΙ 50所 、' 用於回應於此判定而產生基於第二經空間處理 七號之仏號作為輸出信號的構件F1 60(例如,如上文參看 轉變控制模組500及任務Τ1 60所描述)。 圖展示通器件C100之一實例的方塊圖,其可包括如 本文中所揭示之裝置A100或A200之實施例。器件C1 〇〇含 © 有曰a片或晶片組CS 10(例如,如本文中所描述之MSM晶片 組),其經組態以經由天線C3〇而接收射頻通信且經由 擴音器SP10而解碼及再現在RF信號内所編碼之音訊信 號。晶片/晶片組CS10亦經組態以經由μ個麥克風之陣列 (展不兩個麥克風]^^^ 1〇及MC20)而接收Μ頻道音訊信號、 使用裝置Α100或Α200之内部實施例來空間地處理μ頻道信 號、編碼所得音訊信號,且經由天線C30而傳輸描述經編 碼音訊信號之RF通信信號。器件C100亦可在至天線C30之 〇 路徑中包括雙工器及一或多個功率放大器。晶片/晶片組 CS10亦經組態以經由小鍵盤c 10而接收使用者輸入且經由 顯示器C20而顯示資訊。在此實例中,器件C100亦包括一 或多個天線C40以支援全球定位系統(GPS)位置服務及/或 與諸如無線(例如,BluetoothTM)頭戴式耳機之外部器件的 短程通信。在另一實例中’此通信器件自身為Bluetooth頭 戴式耳機且缺少小键盤C10、顯不器C20及天線C 3 0。 提供所描述組態之前述呈現以使任何熟習此項技術者能 137174.doc -78- 200939210 夠製造或使用本文中所;^ + # 个又甲所揭不之方法及其他結構。本文所展 示及描述之流㈣、方塊®、狀態®及其他結構為僅實 例’且此等結構之其他變型亦處於本揭示案之範缚内。對 此等組態之各種修改為可能的,且本文中所呈現之一般原 理亦可應用於其他組態。因此,本揭示案不欲限於上文所 展示之組態,而是符合與在本文中以任何樣式揭示之原理 ❹ ❹ 及新穎特徵-致之最廣泛範疇(包括於所申請之形成原始 揭不之一部分的附加申請專利範圍中)。 如本文中所揭示之裝置之實施例的各種元件可以視為適 於所要應用之硬體、軟體及/或韌體的任何組合來具體 化。舉例而t ’可將此等元件製造為駐留於(例如)同一晶 片^或晶片組中之兩個或兩個以上晶片中的電子及/或光: 器件。此器件之一實例為固定或可程式化邏輯元件(諸 如,電晶體或邏輯閘)陣列,且此等元件中之任一者可實 施為一或多個此等陣列。此等元件中之任何兩者或兩者以 上或甚至全部可實施於相同陣列内。此或此等陣列可實施 於一或多個晶片内(例如’包括兩個或兩個以上晶片之曰 片組内)。 上日日片之晶 本文中所揭示之裝置之各種實施例的一或多個元件亦可 分㈣施為一或多個指令集,其經配置以執行於 "®疋或可程式化邏輯元件陣列上’諸如,微處理 器、嵌人式處理器、ΙΡ核心、數位信號處理器、Fp =m r、assp(特殊應用標準產品)及·(特殊 *、、 ^)。如本μ所冑示之裝置之實施例之各種 I37174.doc •79· 200939210 兀件中的s纟亦可具體化為一或多個電腦(例如,包括 經程式化以執行一或多個指令集或指令序列之—或多個陣 列的機器’亦被稱為"處理器”)’且此等元件中之任何兩者 或兩者以上或甚至全部可實施於相同之此或此等電腦内。 ❹ ❹ 熟習此項技術者應瞭解,結合本文中所揭示之組態而描 述的各種說明性邏輯區塊、模組、電路及操作可實施為電 子硬體、電腦軟體或兩者之組合。此等邏輯區塊、模組、 電路及操作可使用冑用處自器、《位信^處理器 ("DSP”)、ASIC或Assp、FpGA或其他可程式化邏輯器 件、離散閘或電晶體邏輯、離散硬體組件或其經設計以執 行本文中所描述功能之任一組合來實施或執行。通用處理 器可為微處理器,但在替代例中,處理器可為任何習知處 理器、控制器、微控制器或狀態冑。處理器亦可實施為計 算器件之組合,例如,DSP與微處理器之組合、複數個微 處理器、結合DSP核心之一或多個微處理器,或任何其他 此組態。軟體模組可駐留於RAM(隨機存取記憶體)、 ROM(唯讀記憶體)、諸如快閃RAM之非揮發性續 (NVRAM)、可擦可程式化R〇M (EpR〇M)、電可擦可程式 化ROM (EEPR0M)、暫存器、硬碟、抽取式碟、cdr〇m 或此項技術巾已知之㈣其他形叙料媒體巾。說明性 儲存媒㈣接至處理H,使得處理器可自儲存媒體讀取資 訊及向儲存媒體寫入資訊。在替代例中,储存媒體可與處 理器成整體。處理器及儲存媒體可駐留於趟。中。 可駐留於使用者終端機中。在替代例中,處理器及儲存媒 137174.doc -80- 200939210 體可作為離散組件而駐留於使用者終端機中。 ❹ ❿ 應注意’本文中所揭示之各種方法(例如,借助於如本 文中所揭示之裝置之各種實施例之操作的描述)可藉由諸 如處理器之邏輯元件陣列來執行,且如本文中所描述之裝 置之各種7L件可實施為經設計以執行於此陣列上之模組。 如本文中所使用,術語”模組"或”次模組"可指代包括以軟 體、硬體或動體形式之電腦指令(例如,邏輯表達式)的任 何方法、裝置、器件、單元或電腦可讀資料儲存媒體。應 理解,多個模組或系統可組合為一模組或系統,且一模組 或系統可分離為用以執行相同功能之多個模組或系統。者 以軟體或其他電腦可執行指令來實施時,過程之元素本^ 上為用以(諸如)藉由常式、程式、物件、組件、資料結構 及其類似者來執行相關任務之碼段。術語"軟體"應被理解 為包括源碼、組合語言碼、機器碼、二進位碼、_、巨 I微碼可由邏輯疋件陣列執行之任何一或多個指令集 或指令序列’及此等實例之任何組合。程式或碼段可儲存 於處理器可讀媒體中或可經由傳輸媒體或通信鏈路而藉由 具體化於載波中之電腦資料錢來傳輸。 本文_所揭示之方法、方奎 方案及技術之實施例亦可有形地 ,、(例如,在如本文中所列出之一或多個電腦可讀媒 體中)為可由包括邏輯元件陣列(例如,處理器 器、微控制器或其他有限狀態機)之機器讀取及/或執行之 指令集。術語"電腦可讀媒體"可包括可储存或轉 送資訊之任何媒體,包括揮發性、非揮發性、抽取式或非 137174.doc 200939210 抽取式媒體。電腦可讀媒體之實例包括電子電路、半導體 記憶體器件、ROM、快閃記憶體、可擦R〇M (er〇m)、軟
碟或其他磁性儲存器、CD_R〇M/DVD或其他光學儲存器、 硬碟、光纖媒體、射頻(RF)鏈路,或可用以儲存所要資訊 且可經存取之㈣其他媒體。電腦資料信號可包括可經由 諸如電子網路頻道、光學纖維、线、f磁波、rf鍵路等 等之傳輸媒體而傳播的任何信號。可經由諸如網際網路或 企業内部網路之電腦網路而下載碼段。在任一狀況下本 揭示案之範疇不應被解釋為受此等實施例限制。 在如本文中所揭示之方法之實施例的典型應用中,邏輯 元件(例如,邏輯閘)陣列經組態以執行方法之各種任務中 的一者、-者以上或甚至全部”料將任務巾之—或多者 (可能全部)實施為具體化於電腦程式產品(例如,一或多個 資料儲存媒體,諸如’碟片、快閃或其他非揮發性記憶 卡、半導體記憶體晶片,等等)中之程式碼(例如,一或多 個指令集),電腦程式產品可由包括邏輯元件陣列(例如, 處理器、微處理器、微控制器或其他有限狀態機)之機器 (例如’電腦)讀取及/或執行。如本文中所揭示之方法之實 施例的任務亦可由一個以上此陣列或機器執行。在此等或 其他實施財’任務可執行於用於無線通信之器件内,諸 如,蜂巢式電話或具有此通信能力之其他器件。此 經組態以與電路交換及/或封包交換網路通信(例如》 諸如讀之-或多個協定)。舉例而言,此器件可包㈣ 組態以接收經編碼訊框之RF電路。 137174.doc •82· 200939210 已月確地揭不’本文中所揭示之各種方法可由諸如手 、頭戴式耳機或攜帶型數位助理(PDA)之揭帶型通信器 ^卜且本文中所描述之各種裝置可包括有此器件。典 型即時(例如’線上)應用為使用此行動器件而進行 ς 會談。 ° 在—或多個例示性實施例中,所描述功能可以硬體、軟 體、勒體或其任何組合來實施。若以軟體來實施,則功能 作為或夕個心令或程式碼而儲存於一電腦可讀媒體上 © 或、&由該電腦可讀媒體而傳輸。術語"電腦可讀媒體”包括 電腦儲存媒體及通信媒體兩者,其包括促進將電腦程式自 —位置轉送至另一位置之任何媒體。儲存媒體可為可由電 腦存取之任何可用媒體。藉由實例而非限制,此等電腦可 讀媒體可包含:儲存元件陣列,諸如’半導體記憶體(其 可包括(但不限於)動態或靜態RAM、ROM、EEPROM及/或 快閃RAM)或鐵電記憶體、磁電阻記憶體、雙向記憶體、 聚合記憶體或相變記憶體;CD_ROM或其他光碟儲存器 ® 件、磁碟儲存器件或其他磁性儲存器件;或可用以載運或 儲存以指令或資料結構形式之所要程式碼且可由電腦存取 的任何其他媒體。又,可適當地將任何連接稱為電腦可讀 媒體。舉例而言,若使用同軸電纜、光纖電纜、雙絞線、 數位用戶線(DSL)或諸如紅外線、無線電及/或微波之無線 技術而自網站、伺服器或其他遠端源傳輸軟體’則同軸電 現、光纖電纟覽、雙絞線、DSL或諸如紅外線、無線電及微 波之無線技術包括於媒體之界定中。如本文中所使用,磁 137174.doc -83· 200939210
用先碟包括緊密光碟(CD)、雷射光碟、光碟、數位化通 碟(DVD)、軟碟及 Biu-w DiscTM (㈣却 I =atl0n,Universai City,CA),其中磁碟通常磁性地再 •料,而光碟藉由雷射而光學地再現資料。 亦應包括於電料讀㈣之料内。 ·且° Ο ❹ 。如本文中所描述之聲學信號處理裝置可併入至諸如通信 器件之電子器件中’電子器件接受語音輸人,以便控制某: 些功能,或可另外受益於所要雜訊與背景雜訊之分離。許 多應用可受益於加強或分離清楚之所要聲音與發源自多個 方向之背景聲音。此等應用可包括併入有諸如話音辨識及 偵測、語音加強及分離、話音啟動控制及其類似者之能力 的電子或计算器件中之人機介面。可能需要實施此聲學信 號處理裝置以在僅提供有限處理能力之器件中為合適的。 本文中所描述之模組、元件及器件之各種實施例的元件 可製造為駐留於(例如)同一晶片上或晶片組中之兩個或兩 個以上晶片當中的電子及/或光學器件。此器件之一實例 為固定或可程式化邏輯元件(諸如,電晶體或閘)陣列。本 文中所描述之裝置之各種實施例的一或多個元件亦可整個 或部分地實施為一或多個指令集,其經配置以執行於一或 多個固定或可程式化邏輯元件陣列上,諸如,微處理器、 嵌入式處理器、IP核心、數位信號處理器、FPGA、ASSp 及 ASIC。 有可能使本文中所描述之裝置之實施例的一或多個元件 用以執行不直接關於裝置之操作的任務或執行不直接關於 137174.doc -84- 200939210 裂置之操作的其他指令集,諸如,關於嵌入有裝置之器件 3 之另操作的任務。亦有可能使此裝置之實施例的 或多個元件具有共同結構(例如,用以在不同時間執行 程式碼之對應於不同元件之部分的處理器、經執行以在不 同時間執行對應於不同元件之任務的指令集,或在不同時 間針對不同元件而執行操作的電子及/或光學器件配置)。 J而D 20-1、20-2及/或7〇可經實施以在不同時 間包括同一結構。在另一實例中,濾波器組ι〇〇及/或濾波 ❹_組200之實施例的一或多個空間分離濾波器可經實施以 在不同時間包括同一結構(例如,在不同時間使用不同渡 波器係數值集合)。 【圖式簡單說明】 圖1A說明包括裝置A1〇〇之一實施例之手機m〇〇的操作 組態。 圖1B說明手機H100之另一操作組態。 圖2展示手機H100之可能定向範圍。 © 圖3A及圖3B說明用於如圖丨A所示之手機⑴㈧之操作組 態的兩個不同操作定向。 圖4A及圖4B說明用於如圖ιΒ所示之手機H1〇〇之操作組 態的兩個不同操作定向。 圖5說明對應於手機H100之三個不同定向狀態的區域。 圖6A至圖6C展示手機H100之源原點區域的額外實例。 圖7A說明手機H100之實施例Hll〇。 圖7B展示手機H110之兩個額外視圖。 137174.doc -85 - 200939210 圖8展示根據一通用組態之裝置A200的方塊圖。 圖9展示頭戴式耳機63之兩個不同定向狀態。 圖10展示裝置A200之兩頻道實施例A210的方塊圖。 圖11展示包括濾波器組120之兩頻道實施例13〇之裝置 A210之實施例A220的方塊圖。 圖12展示切換機構350之實施例352的方塊圖。 圖13展示切換機構352及360之實施例362的方塊圖。 圖14A至圖14D分別展示狀態估計器400之四個不同實施 ❹例402 、 404 、 406及408 ° 圖I5展示裝置A220之實施例A222的方塊圖。 圖1 6展示狀態估計器412之實施例414的實例。 圖17展示裝置A2 10之實施例A2 14的方塊圖。 圖18展示裝置A222之實施例A224的方塊圖。 圖19展示裝置A210之實施例A216的方塊圖。 圖20展示轉變控制模組500之實施例520的方塊圖。 圖21展示轉變控制模組500之實施例550的方塊圖。 © 圖22展示混合器70a至70m中之第j者之實施例72j的方塊 圖。 圖23展示混合器組700之兩頻道實施例710的方塊圖。 圖24展示裝置A210之實施例A218的方塊圖。 圖25展示裝置A220之實施例A228的方塊圖。 圖26展示裝置A228之實施例A229的方塊圖。 圖27展示裝置A210之實施例A210A的方塊圖。 圖28展示裝置A220之實施例A224A的方塊圖。 137174.doc • 86 - 200939210 圖29展示裝置A220之實施例A232的方塊圖。 圖30展示裝置A220之實施例A234的方塊圖。 圖31展示裝置A220之實施例A236的方塊圖。 圖32A及圖32B展示指示符功能值至經估計狀態S50之兩 個不同映射。 圖33Α至圖33C分別展示裝置Α200之實施例Α310、Α320 及Α330的方塊圖。 圖34說明衰減方案之一實例。 〇 圖35Α展示裝置Α210之實施例Α210Β的方塊圖。 圖35Β展示回音消除器EC10之實施例EC12的方塊圖。 圖35C展示回音消除器EC20之實施例EC22的方塊圖。 圖3 6展示設計及使用程序之流程圖。 圖37展示方法Μ10之流程圖。 圖3 8展示經組態以用於記錄訓練資料之聲學無回音腔室 的實例。 圖39展示免持汽車套組83之實例。 © 圖4〇展示圖37之汽車套組之應用的實例。 圖41展示具有線性麥克風陣列之寫入儀器(例如,筆)或 尖筆79的實例。 圖42展示在設計階段期間置放於兩點源雜訊場中之手 機。 圖43Α展示包括一對反饋濾波器C110及cl2〇之調適性濾 波器結構FS10的方塊圖。 圖43B展示包括直接濾波器D11〇及D12〇之濾波器結構 137174.doc -87- 200939210 FS10之實施例FS20的方塊圖。 圖44展示根據一通用組態之裝置a 1 〇〇的方塊圖。 圖45展示裝置A100之實施例A110的方塊圖。 圖46展示裝置A100之實施例A120的方塊圖。 圖47展示方法Ml 〇〇之流程圖。 圖48展示裝置Fl〇〇之方塊圖。 圖49展示包括裝置a丨〇〇或A2〇〇之實施例之通信器件 C1 00的方塊圖。 Ο 【主要元件符號說明】 ❹ 20 話音活動性偵測器 20-1 例項/話音活動性偵測器 20-2 例項/話音活動性偵測器 30 不相關雜訊偵測器 60j 求和器 63 頭戴式耳機/實例 64 使用者之口 65 使用者之耳朵 66 操作組態範圍/頭戴式耳機安裝可變性 67 麥克風陣列 70 例項/話音活動性偵測器 70a 混合器 70b 混合器 7〇j 混合器 70m 混合器 137174.doc 88 - 200939210 72j 實施例/混合器 74a 混合器 74b 混合器 79 器件 80 麥克風 81 繪圖表面 82 刮擦雜訊 100 濾波器組 〇 120 實施例/濾波器組 130 實施例/濾波器組 132 滤波器組 134 滤波器組 136 滤波器組 140 兩濾波器實施例 150 兩濾波器實施例 200 濾波器組 〇 240 兩遽波器實施例 250 兩滤波器實施例 300 切換機構 305 實施例/轉變控制模組 350 切換機構 352 實施例/切換機構 360 實施例/切換機構 362 特定實施例/切換機構 137174.doc -89- 200939210
364 實施例/切換機構 366 實施例/切換機構 368 實施例/切換機構 368A 實施例/切換機構 370 切換機構 372 實施例/切換機構 374 實施例/切換機構 374A 實施例/切換機構 378 實施例/切換機構 379 實施例/切換機構 400 狀態估計器 401 實施例/狀態估計器 402 實施例/狀態估計器 404 實施例/狀態估計器 406 實施例/狀態估計器 408 實施例/狀態估計器 412 實施例/狀態估計器 414 實施例/狀態估計器 416 實施例/狀態估計器 420 實施例/狀態估計器 450 調適性濾波器 460 雜訊降低濾波器 500 轉變控制模組 501 實施例/轉變控制模組 137174.doc -90- 200939210
510 實施例/轉變控制模組 520 實施例/轉變控制模組 550 實施例/轉變控制模組 550a 分離量測計算器 550b 分離量測計算器 555 實施例/轉變控制模組 560 比較器 600 滯留邏輯 610 實施例/滯留邏輯 700 混合器組 710 實施例/混合器組 A1 區域 A2 區域 A3 區域 A110 實施例/裝置 A120 實施例/裝置 A200 裝置 A210 實施例/裝置 A210A 實施例 A210B 實施例/裝置 A214 實施例/裝置 A216 實施例/裝置 A218 實施例/裝置 A220 實施例/裝置 137174.doc -91 - 200939210 A222 實施例/裝置 A224 實施例/裝置 A224A 實施例/裝置 A228 實施例/裝置 A229 實施例/裝置 A234 裝置 A236 實施例/裝置 A310 實施例/裝置 〇 Α320 實施例/裝置 Α330 實施例/裝置 CIO 小鍵盤 C20 顯示器 C30 天線 C40 天線 C100 通信器件 C110 反饋濾、波器 〇 C120 反饋濾波器 CE10 遽波器 CE20 加法器 CS10 晶片或晶片組 D110 直接濾波器 D120 直接濾波器 EC10 回音消除器 EC12 實施例/回音消除器 137174.doc -92- 200939210 EC20a 例項/回音消除器 EC20b 例項/回音消除器 EC22 實施例/回音消除器 F10-1 空間分離濾波器/空間處理濾波器 F10-2 空間分離濾波器/空間處理濾波器 FlO-n 空間分離濾波器/空間處理濾波器 F14-1 空間分離濾波器 F14-2 空間分離濾波器 ❹ F14-3 空間分離濾波器/透通濾波器 F14-4 空間分離濾波器 F14-5 空間分離濾波器 F14-6 空間分離濾波器 F14-n 空間分離濾波器 F16-1 滤波器 F16-2 遽波器 F18-1 濾波器 〇 F18-2 濾波器 F20-1 空間處理濾波器 F20-2 空間處理濾波器 F20-n 空間處理濾波器 F26-1 遽波器 F26-2 遽波器 F28-1 濾波器 F28-2 濾波器 137174.doc -93- 200939210
F100 裝置 F110 F120 F130 用於對輸入信號執行第一操 用於對輸入信號執行第 用於在第-時間判定第一構件的:: 第 而分離語音分量與雜訊分量的構件 二構件 F140 用於產生基於第一信號之信號作為輪 出信號 的構件 F150 用於在第二時間判定第二構件優於第 而分離語音分量與雜訊分量的構件 ~~構件 F160 用於產生基於第二信號之信號作為輪 出信號 的構件 FS10 調適性濾波器結構 FS20 實施例/濾波器結構 H100 兩麥克風手機 H110 實施例/手機 11 輸入頻道 12 輸入頻道 MC10 主要麥克風 MC20 次要麥克風 MC30 第三麥克風 01 輸出頻道 02 輸出頻道 S10 Μ頻道輸入信號 S10-1 輸入頻道 137174.doc ·94· 200939210 S10-2 輸入頻道 S 1 0-m 輸入頻道 SlOa 經消除回音信號 S15 遠端音訊信號 S20-1 經空間處理信號 S20-n 經空間處理信號 S20jl 經濾波頻道 S20j2 經濾波頻道 ❹ S20jn 經濾波頻道 S20ml 經濾波頻道/語音頻道 S20m2 經濾波頻道 S20mn 經濾波頻道/語音頻道 S30-1 經空間處理信號 S30-n 經空間處理信號 S40 Μ頻道輸出信號 S40-1 輸出頻道/語音頻道 〇 S40-2 輸出頻道/雜訊頻道 S40-J 輸出頻道 S40-m 輸出頻道 S42 輸出信號 S42-1 語音信號 S42-2 雜訊頻道 S45 經遽波語音信號 S50 經估計定向狀態指示/經估計狀態 137174.doc -95- 200939210
S60 轉變控制信號 S70 更新控制信號 S70-1 更新控制信號 S70-2 更新控制信號 S75 更新控制信號 S80 偵測指示 S90 輸出控制信號 S90-1 例項/輸出控制信號 S90-2 例項/輸出控制信號 S201n 經濾波頻道/語音頻道 S202n 經濾波頻道/語音頻道 S2011 經遽波頻道/語音頻道 S2012 經濾波頻道/語音頻道 S2021 經濾波頻道/語音頻道 S2022 經濾波頻道/雜訊頻道 SP10 主要揚聲器/擴音器 SP20 次要揚聲器 137174.doc 96-

Claims (1)

  1. 200939210 十、申請專利範圍: l 一種處理一包括一語音分量及-雜訊分量之職道輸入 信號以產生一經空pBH、企认, 間,慮皮輸出信號的方法,Μ為一大於 一之整數,該方法包含: 、 將第-空間處理據波器應用至該輸入信號; 將-第二空間處理遽波器應用至該輸入信號; 在第肖間,判定該第一空間處理據波器優於該第 Ο 二空間處理濾波器而開始分離該語音分量與該雜訊分 量; 第一經 回應於在-第-時間之該判定,產生一基於 空間處理信號之信號作為該輸出信號; 在該第-時間之後的一第二時間,判定該第二空間處 H皮H優於該第—空間處理渡波器而開始分離該語音 分量與該雜訊分量;及 回應於在一第二時間之該判定,產生一基於一第二經 空間處理信號之信號作為該輸出信號, 其中該第-經空間處理信號及該第二經空間處理信號 係基於該輸入信號。 2.如胡求項1之方法’其中該第一空間處理濾波器及該第 二空間4理濾波器中之至少一者的複數個係數值係基於 在複數個不同聲學情境下所記錄之複數個多頻道訓練信 號。 •—工 月求項1之方法’其中該第一空間處理濾波器及該第 間處理遽波器中之至少-者的複數個該等係數值係 I37174.doc 200939210 獲自一基於複數個多頻道訓練信號之經收斂濾波器狀 態,其中該複數個多頻道訓練信號係在複數個不同聲學 情境下被記錄。 4. 如凊求項1之方法,其中該第—空間處理滤波器之複數 個該等係數值係基於在第__複數個不同聲學情境下所記 錄之複數個多頻道钏練信號,且 其十該第二空間處理據波器之複數個該等係數值係基 於在第一複數個不同冑學情境下所記錄之複數個多頻道 〇 1)1丨、m該第二複數個不同聲學情境不同於該第-複 數個不同聲學情境。 5. 如凊求項1之方法,#中該將該第一空間處理遽波器應 用至該輸入乜號產生該第一經空間處理信號,且其中該 將”亥第一空間處理攄波器應用至該輸人信號產生該第二 經空間處理信號。 6. 〇 如明求項5之方法’其中該產生一基於一第一經空間處 理信號之信號作為該輸出信號包含產生該第一經空間處 理信號作為該輸出信號,且 其中該產生-基於一第二經空間處理信號之信號作為 該輸出信號包含產攻士_ 度生δ亥第一經空間處理信號作為該輸出 信號。 月求項1之方法,其中該第一空間處理濾波器係藉由 係數值矩陣而特徵化,且該第二空間處理渡波器 係藉由一第二係數值矩陣而特徵化,且 其中該第二矩陣至少大體上等於圍繞一中心垂直轴線 137174.doc -2 - 200939210 而翻轉該第一矩陣之結果。 8,如請求項1之方法’其中該方法包含判定該第一空間處 理濾波器在緊接於該第一時間之後之一第一延遲時間間 隔上優於該第二空間處理濾波器而繼續分離該語音分量 與該雜訊分量,且 其中該產生一基於一第一經空間處理信號之信號作為 該輸出信號在該第一延遲時間間隔之後開始。 9.如請求項8之方法,其中該方法包含判定該第二空間處 〇 理遽波11在緊接於該第二時間之後之-第:延遲時間間 隔上優於該第一空間處理濾波器而繼續分離該語音分量 與該雜訊分量,且 二中該產生一基於一第二經空間處理信號之信號作為 該輸出信號在該第二延遲時間間隔之後發生且 ❹ 其中該第二延遲時間間隔長於該第一延遲時間間隔。 ίο.如請求们之方法’其中該產生一基於一第二經空間處 王^號之信號作為該輸出信號包括在-第-合併時間間 隔上將該輸出信號自基於該第一經空間處理信號之該信 號轉變為一基於該第二經空間處理信號之信號,且 其中該轉變包括在該第一合併時間間隔期間產生一美 於:第-經空間處理信號及該第二經空間處理信號兩: 之#號作為該輸出信號。 11.如請求項1之方法,其中該方法包含: 將第二空間處理濾波器應用至該輸入信號; 在該第二時間之後之一第三時間,判定該第三空間處 137174.doc 200939210 理濾波器優於該第一办 虛虑 工間處理濾波器且優於該第二空間 處理慮波器而開始分五 回應於在一第_時門……刀量與該雜訊分量;及 ㈣定,產生—基於—第三經 處域之信號作為該輸出信號, =該第三經空間處理信號係基於該輸入信號。 ❹ “項11之方法’其中該產生-基於-第二經空間處 ㈣叙信料為該Μ㈣包括在—卜合併時間間 隔上將該輸出k號自基於該第 '經空間處理信號之該信 號轉變為-基於該第二經空間處理信號之信號,且 ’、中該產生-基於-第三經空間處理信號之信號作為 以輸出L號包括在-第二合併時間間隔上將該輸出信號 自基於該第:經空間處理信號之該信號轉變為—基於該 第三經空間處理信號之信號, 其中該第二合併時間間隔長於該第一合併時間間隔。 13·如請求項1之方法,其中該將一第一空間處理濾波器應 用至該輸入信號產生一第一經渡波信號,且 其中該將一第二空間處理濾波器應用至該輸入信號產 生一第二經濾波信號,且 其中在一第一時間之該判定包括偵測該輸入信號之一 頻道與該第一經濾波信號之一頻道之間之一能量差大於 該輸入信號之該頻道與該第二經濾波信號之一頻道之間 之一能量差。 14.如請求項1之方法’其中該將一第一空間處理濾波器應 用至該輸入信號產生一第一經濾波信號,且 137174.doc -4- 200939210 :中該將-第二空間處理遽波器應用至該輸入信號產 生第一經濾波信號,且 其中在一第-時間之該判定包括價測該第一 號之兩個頻道之間之—相關之值小於該第二_波^ 之兩個頻道之間之一相關之值。 机说 15. ❹ 16. ❹ 17. 如凊求項1之方法,装一 田5〜 #中β歸第-空間處理濾波器應 用至該輸入信號產生一第一經濾波信號,且 其中該將-第二空間處理濾波器應用至該輸入信號產 生一第二經濾波信號,且 其中在-第-時間之該判定包括備測該第一經據波信 號之頻道之間之-能量差大於該第二經錢信號之頻道 之間之一能量差。 如唄求項1之方法,其中該將一第一空間處理濾波器應 用至該輸入信號產生一第一經濾波信號,且 其中該將一第二空間處理濾波器應用至該輸入信號產 生一第二經濾波信號,且 其中在一第一時間之該判定包括偵測該第—經濾波信 號之—頻道之一語音量測之值大於該第二經濾波信號之 一頻道之語音量測之值。 如請求項1之方法,其中該將一第一空間處理濾波器應 用至該輸入信號產生一第一經渡波信號,且 其中该將一第二空間處理濾波器應用至該輸入信號產 生一第二經濾波信號,且 其中在一第一時間之該判定包括計算該輸入信號之兩 137174.doc -5- 200939210 個頻道當中之一到達時間差。 18’=求項1之方法’其中該方法包含基於該輪師贫之 頻道而應用一雜訊參考’以降低該輪出作;:另 -頻道中的雜訊。 印亿號之另 19.:種用於處理一包括一語音分量及一雜訊分量 」广以產生一經空間據波輸出信號的裝 大於一之整數,該裝置包含: 馬 ❹ ❹ 人=執行一第一空間處理操作的構件; :於對該輸入㈣行一第二空間處理操作的構件. 用於在一第一時間判定該用於執行— , 作之構件優於該用於執行—第二空間處^處理操 開始分離該語音分量與該雜訊分量的構件;、之構件而 用於回應於一來自該用於在一 的指示而產生一基於一第一經丄^之判定之構件 該輸出信號的構件; 5 ^號之信號作為 一用於在該第-時間之後的—第二時間判定該用 一第二空間處理操作之構件優於該用於 —仃 處理操作之構件而開始分離該語音分 間 構件:及 、飞雜訊分量的 第二時間之判定之構件 間處理信號之信號作為 用於回應於一來自該用於在— 的指示而產生一基於一第二經空 該輸出信號的構件, 二經空間處理信號 其中該第一經空間處理信號及該第 係基於該輸入信號。 137I74.doc 200939210 求物之裝置,其中⑷該用於執行一第一空間處理 :作之構件及(B)該用於執行一第二空間處理操作之構件 中之至少-者的複數個係數值係基於在複數個不同聲學 情境下所記錄之複數個多頻道訓練信號。 于 21. ^求項19之裝置,其中該用於對該輸人信號執行該第 :空間處理操作之構件經組態以產生該第—經空間處理 ^號’且其中該用於對該輸人信號執行該第二空間處理 操作之構件經組態以產生該第二經空間處理信號,且 作用於產生一基於一第一經空間處理信號之信號 丄‘、’、U〕出信號之構件經組態以產生該第一經空間處理 k號作為該輸出信號,且 作:::用:產生一基於一第二經空間處理信號之信號 ^出信號之構件經組態以產生該第二經空間 k號作為該輸出信號。 ❹ 22· 2求们9之裝置’其中該裝置包含用於判定該用於執 仃—第—$間處理操作之構件在緊接於該第一日夺間之後 第延遲時間間隔上優於該用於執行一第二空間處 =操作之構件而繼續分離該語音分量與該雜訊分量的構 1干,且 其中今从 作為該=ϋ基於一第- '經冑間處理信號之該信號 z 3出k號之構件經組態以在該第一延遲時間門隔 之^開始產生該信號。 門:长項19之裝置,其中該用於產生一基於-第二經空 間處理_號夕P 、土工 號作為該輸出信號之構件包括用 I37I74.doc 200939210 :一合併時間間隔上將該輸出信號自基於該第-經空間 之信號的構件,且 基於該第二經空間處理信號 =用於轉變之構件經組態以在該第一合併時間間 =間產生-基於該第—經空間處理信號及該第二經空 間處理信號兩者之信號作為該輸出信號。 〇 一月求項19之裝置’其中該用於對該輸入信號執行一第 -空間處理操作之構件產生一第一經濾波信號,且 其中該用於對該輸入信號執行一第二空間處理操作之 構件產生一第二經濾波信號,且 給中。亥用於在-第-時間之判定之構件包括用於偵測 該輸入信號之—頻道與該第—㈣波信號之—頻道之間 之-能量差大於該輸入信號之該頻道與該第二經濾波信 號之一頻道之間之一能量差的構件。 25.如請求項19之裝置’其中該用於對該輸人信號執行-第 -空間處理操作之構件產生一第一經濾波信號,且 、中該用於對⑦輸人#號執行_第二空間處理操作之 構件產生一第二經濾波信號,且 其中該用於在-第-時間之判定之構件包括用於偵測 該第-經濾波信號之兩個頻道之間之一相關之值小於該 第,經濾波信號之兩個頻道之間之一相關之值的構件。 :求項19之裝置,其中該用於對該輸入信號執行一第 間處理操作之構件產生—第—經濾波信號,且 其中該用於對該輸入信號執行—第二空間處理操作之 137174.doc 200939210 構件產生一第二經濾波信號,且 其中該用於在一第一時間之判定之構件包括用於偵測 該第一經濾波信號之頻道之間之一能量差大於該第二經 滤波信號之頻道之間之一能量差的構件。 27·如請求項19之裝置,其中該用於對該輸入信號執行一第 一空間處理操作之構件產生一第一經濾波信號,且 其中該用於對該輸入信號執行一第二空間處理操作之 構件產生一第二經濾波信號,且 〇 其中該用於在一第一時間之判定之構件包括用於偵測 該第一經濾波信號之一頻道之一語音量測之值大於該第 二經濾波信號之一頻道之語音量測之值的構件。 28·如請求項19之裝置,其中該裝置包含一麥克風陣列該 麥克風陣列經組態以產生該輸入信號所基於之一河頻道 信號。 29. 如請求項19之裝置,其中該裝置包含用於基於該輸出信 號之至少一頻道而應用一雜訊參考以降低該輸出信號之 © 另一頻道中之雜訊的構件。 30. —種用於處理一包括一語音分量及一雜訊分量之M頻道 輸入信號以產生一經空間濾波輸出信號的裝置,M為一 大於一之整數,該裝置包含: 一第一空間處理濾波器,其經組態以對該輸入信號進 行濾波; 一第二空間處理濾波器,其經組態以對該輸入信號進 行濾波; 137174.doc -9- 200939210 一狀態估計器,其經組態以在一第一時間指示該第一 空間處理濾波器優於該第二空間處理濾波器而開始分離 該語音分量與該雜訊分量;及 一轉變控制模組’其經組態以回應於在一第一時間之 該指示而產生一基於一第一經空間處理信號之信號作為 該輸出信號, 其中該狀態估計器經組態以在該第一時間之後之一第 二時間指示該第二空間處理濾波器優於該第一空間處理 Ο 濾波器而開始分離該語音分量與該雜訊分量,且 其中該轉變控制模組經組態以回應於在一第二時間之 該指示而產生一基於一第二經空間處理信號之信號作為 該輸出信號,且 其中該第一經空間處理信號及該第二經空間處理信號 係基於該輸入信號。 31. 如睛求項30之裝置’其中該第一空間處理濾波器及該第 一空間處理濾波器中之至少一者的複數個係數值係獲自 © —基於複數個多頻道訓練信號之經收斂濾波器狀態,其 中該複數個多頻道訓練信號係在複數個不同聲學情境下 被記錄。 32. 如明求項3〇之裝置,其中該第一空間處理濾波器經組態 以回應於該輸入信號而產生該第一經空間處理信號,且 其中該第—空間處理濾波器經組態以回應於該輸入信號 而產生該第二經空間處理信號, 其中該轉變控制模組經組態以藉由產生一第一經空間 137174.doc 200939210 處理信號作I##I 輸出信號而產生一基於該第一經空間處 :號之^號作為該輸出信號,且 :°亥轉變控制模組經組態以藉由產生一第二經空間 號作為δ亥輸出信號而產生一基於該第二經空間處 理信號之信號作為該輸出信號。 33. ❹ 34. ❹ 35. 如清求項3 〇之梦署廿 一办 、置其中該狀態估計器經組態以判定該 -空間處理濾波器在緊接於該第一時間之後之一第_ 、夺門間隔上優於該第二空間處理濾波器而繼續分離 該語音分量與該雜訊分量且 、u轉變控制模組經組態以在該第一延遲時間間隔 期間,產生—其# 土;該第二經空間處理信號之信號作為該 輸出信號,且 :u轉變控制模組經組態以在該第一延遲時間間隔 w ’產生基㈣第m間處理信號之該信號作為該 月长項30之裝置’其中該轉變控制模組經組態以藉由 在一第—合併時間間隔上將該輸出信號自基於該第-經 :間處理信號之該信號轉變為一基於一第二經空間處理 :之乜號而產生基於該第二經空間處理信號之該信號 作為該輸出信號,且 ^中在該第-合併時間間隔期間,該轉變控制模組經 、=以產生一基於該第 '經空間處理信號及該第二經空 處理信號兩者之信號作為該輸出信號。 如請求項30之裝置 其中該第一空間處理濾波器經組態 137174.doc -11 - 200939210 以回應於該輸入信號而產生—第一經濾波信號,且 其中該第二空間處理渡波器經組態以回應於該輸入信 號而產生一第二經濾波信號,且 其中該狀態估計器經組態以藉由偵測該輸入信號之一 頻道與該第經滤波信號之一頻道之間之一能量差大於 該輸入信號之該頻道與該第二經濾波信號之一頻道之間 之-能量差而在該第-時間判定該第—空間處理滤波器 ❹ 36. ❹ 37. 優於該第一二間處理渡波器而開始分離該語音分量與該 雜訊分量。 如π求項3G之裝置,其中該第_ ^間處理滤波器經組態 以回應於該輸入信號而產生-m皮信號,且 β /、中該第—空間處理濾波器經組態以回應於該輸入信 號而產生一第二經濾波信號,且 其中該狀態估計器經組態以藉由偵測該第一經濾波信 號之兩個頻道之間之—相關之值小於該第二經纽信號 =個頻道之間之—相關之值而在該第—時間判定該第 門處理濾波器優於該第二空間處理濾波器而開始分 離該語音分量與該雜訊分量。 如請求項30之裝置’其中該第一空間處理據波器經組態 以回應於該輸入信號而產生一第一經濾波信號,且 其中該第二空間處理濾波器經組態以回應於該輸入信 號而產生—第二經濾波信號,且 ”其中該狀態估計器經組態以藉由偵測該第一經濾波信 號之頻道之間之__能量差大於該第二經據波信狀頻道 137174.doc •12· 200939210 之間之一能量差而在該第一時間判定該第—空間處理濾 波器優於該第二空間處理濾波器而開始分離該語音分量 與該雜訊分量。 如叻求項30之裝置’其中該第一空間處理濾波器經組態 以回應於該輸入信號而產生一第一經濾波信號,且 ”其中該帛二空間處理渡波器經組態以回應於該輸入信 號而產生一第二經濾波信號,且 八中η亥狀態估§(•器經組態以藉由偵測該第一經遽波信 ❹ ^之-頻道之-語音量測之值大於㈣狀 一頻道之語音量測之值而在該第一時間判定該第一空間 處理濾波器優於該第二空間處理濾波器而開始分離該語 音分量與該雜訊分量。 39.如請求項3〇之裝置,其中該裝置包含一麥克風陣列,該 麥克風陣列經組態以產生該輸入信號所基於之一 %頻道 信號。 ❹ 求項30之裝置’其中該裝置包含—雜訊降低濾波 該雜訊降低渡波器經組態以基於該輸出信號之至少 -頻道而應用—雜訊參考以降低該輸出信號之另一頻道 中的雜訊。 41 -種包含指令之電腦可讀媒體’該等指令在由一處理器 ^仃時使該處理器執行—處理—包括_語音分量及一雜 =分量之Μ頻道輸入信號以產生一經空間渡波輸出信號 =法,Μ為-大於—之整數,該等指令包含在由一處 ^執行時使該處理器進行以下操作之指令: 137174.doc • U· 200939210 對該輸人錢執行H間處理操作. 對該輸人錢執行H間處理操作; 4二:間,指示該第一空間處理操作優於該第二 二間處理刼作而開始分離 π ^ A ^ 日刀量與該雜訊分量; 回應於在一第一時間之該指 Ba . 下 產生一基於一第一經 二間處理信號之信號作為該輸出信號; :該第-時間之後的一第二時;’,指示該第二空間處 理操作優於該第一空間虛 乐1間處理刼#而開始分離該語音分量 與該雜訊分量;及 生一基於一第二經 9 二經空間處理信號 回應於在一第二時間之該指示,產 空間處理信號之信號作為該輸出信號 其中該第一經空間處理信號及該第 係基於該輸入信號。 42.如請求項41之電腦可讀搵躲 J »貢媒體,其中該第一空間處理操作 及該第二空間處理操作φ 铞作中之至少一者的複數個係數值係 獲自-基於複數個多頻道训練信號之經收斂滤波器狀 〇 態,其中該複數個多頻道訓練信號係在複數個不同聲學 情境下被記錄。 43·如請求項41之電腦可讀媒體,其中在由—處理器執行 時,使該處理器對該輸入信號執行該第一空間處理操作 之該等指令使該處理器產生該第—經空間處理信號,且 其中在由-處理器執行時,使該處理器對該輸入信號執 仃該第一空間處理操作之該等指令產生該第二經空間處 理信號, 137174.doc •14· 200939210 其t在由一處理器執行 第-經空間處理信號之該處理器產生-基於- 而使該處理器產生該第輸出信號之該等指令 味’ B 、二間處理信號作為該輸出信 …由-處理器執行時使該處 二經空間處理信號之信號 ,基於第 佶哕虚瑰哭“ 則乍為該輸出信號之該等指令而 使該處理|§產生該第二办 號。 二間處理信號作為該輸出信 〇 44. ❹ 45. 如請求項41之電腦可讀拔 扭哭拍… W讀媒體’其中該媒體包含在由-處 里器執订時’使該處理器進行以下操作之指令:判定該 第二間處理操作在緊接於該第一時間之後之一第一延 遲時間間隔上優於該第二空間處理操作而繼續分離該語 音分量與該雜訊分量,且 其中在由一處理器執行時,使該處理器產生基於一第 虻二間處理信號之該信號作為該輸出信號之該等指令 而使該處理器在該第—延遲時間間隔之後開始產生該作 號。 ° 如請求項41之電腦可讀媒體,其中在由一處理器執行時 使該處理器產生一基於一第二經空間處理信號之信號作 為該輸出信號之該等指令包括在由一處理器執行時使該 處理器進行以下操作之指令:在一第一合併時間間隔 上’將該輸出信號自基於該第一經空間處理信號之該信 號轉變為一基於該第二經空間處理信號之信號,且 其中在由—處理器執行時使該處理器轉變之該等指令 137174.doc • 15_ 200939210 包括在由一處理器執行時 令:在該第-合併時間間隔;=進行以下操作之指 空間處理信號及該第二經^生一基於該第一經 該輸出信號。 處理信號兩者之信號作為 46.如請求項41之電腦可讀媒 . 、體,其中在由一處理器執行時 彳°琥執仃—第一空間處理操作之該 等才曰令使該處理器產生—第—經遽波信號,且 其中在由一處理器執行時 ❹
    行一坌_介„ & 使該處理器對該輸入信號執 :_第〜間處理操作之該等指令使該處理器產生一第 一經遽波信號,且 -其中在由一處理器執行時使該處理器在一第一時間指 不之該等指令包括在由—處理器執行時使該處理器進行 乂下操作之扣令.偵測該輸入信號之一頻道與該第一絰 據波信號之-頻道之間之—能量差大於該輸人信號之該 頻道與該第n皮信號之—頻道H能量差。 47.如請求項41之電腦可讀媒體,其中在由—處理器執行時 使該處理器對該輸人信號執行—第—空間處理操作之該 等指令使該處理器產生一第一經濾波信號,且 其中在由一處理器執行時使該處理器對該輸入信號執 行一第二空間處理操作之該等指令使該處理器產生一第 二經濾波信號,且 其中在由一處理器執行時使該處理器在一第一時間指 示之該等指令包括在由一處理器執行時使該處理器進行 以下操作之指令:偵測該第一經濾波信號之兩個頻道之 I37174.doc -16- 200939210 間之#關之值小於該第二纟輯波信號之兩個頻道之 之一相關之值。 B 48.如請求利之電腦可讀媒體’其中在由一處理器執 使該處理器對該輸入信號執行一第一空間處理操作之, 等指令使該處理器產生一第一經據波信號,且 ^ 其中在由-處理器執行時使該處理器對該輸入信號執 行一第二空間處理操作之該等指令使該處理器產生一第 二經濾波信號,且 Ο _其中在由一處理器執行時使該處理器在-第一時間指 示之該等指令包括在由—處理器執行時使該處理器進行 以下操作之指令:偵測該第-經滤波信號之頻道之間之 -能量差大於該第二經據波信號之頻道之間之一能量 差。 49·如請求項41之電腦可靖碰躲 ^ . ^ t ^ 电胸j項媒體,其中在由一處理器執行時 使該處理器對該輸人信號執行—第—空間處理操作之該 等指令使該處理器產生一第一經遽波信號,且 "其中在由-處理器執行時使該處理器對該輸入信號執 行第一二間處理操作之該等指令使該處理器產生一第 一經遽波信號,且 八中在由處理器執行時使該處理器在一第一時間指 厂、s等扣7包括在由一處理器執行時使該處理器進行 、立操作之私7 .偵測該第一經濾波信號之一頻道之一 °s量測之值大於該第二經遽波信號之-頻道之語音量 測之值。 137174.doc 200939210 5〇·如請求項41之電腦可讀媒體,其中該媒體包含在由一處 理器執行時使該處㈣進行以下操 出信號夕s , 相7 ·基於該輸 至夕一頻道而應用一雜訊參考 信號之另—以降低該輸出 力頻道中的雜訊。
    137174.doc
TW097149913A 2007-12-19 2008-12-19 Systems, methods, and apparatus for multi-microphone based speech enhancement TW200939210A (en)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US1508407P 2007-12-19 2007-12-19
US1679207P 2007-12-26 2007-12-26
US7714708P 2008-06-30 2008-06-30
US7935908P 2008-07-09 2008-07-09
US12/334,246 US8175291B2 (en) 2007-12-19 2008-12-12 Systems, methods, and apparatus for multi-microphone based speech enhancement

Publications (1)

Publication Number Publication Date
TW200939210A true TW200939210A (en) 2009-09-16

Family

ID=40789657

Family Applications (1)

Application Number Title Priority Date Filing Date
TW097149913A TW200939210A (en) 2007-12-19 2008-12-19 Systems, methods, and apparatus for multi-microphone based speech enhancement

Country Status (7)

Country Link
US (1) US8175291B2 (zh)
EP (1) EP2229678A1 (zh)
JP (1) JP5479364B2 (zh)
KR (1) KR101172180B1 (zh)
CN (1) CN101903948B (zh)
TW (1) TW200939210A (zh)
WO (1) WO2009086017A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8908883B2 (en) 2010-12-14 2014-12-09 National Chiao Tung University Microphone array structure able to reduce noise and improve speech quality and method thereof
TWI511126B (zh) * 2012-04-24 2015-12-01 Polycom Inc 麥克風系統及噪音消除方法

Families Citing this family (194)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8019091B2 (en) 2000-07-19 2011-09-13 Aliphcom, Inc. Voice activity detector (VAD) -based multiple-microphone acoustic noise suppression
US8280072B2 (en) 2003-03-27 2012-10-02 Aliphcom, Inc. Microphone array with rear venting
US9066186B2 (en) 2003-01-30 2015-06-23 Aliphcom Light-based detection for acoustic applications
US9099094B2 (en) 2003-03-27 2015-08-04 Aliphcom Microphone array with rear venting
US7099821B2 (en) * 2003-09-12 2006-08-29 Softmax, Inc. Separation of target acoustic signals in a multi-transducer arrangement
US8543390B2 (en) * 2004-10-26 2013-09-24 Qnx Software Systems Limited Multi-channel periodic signal enhancement system
US9185487B2 (en) 2006-01-30 2015-11-10 Audience, Inc. System and method for providing noise suppression utilizing null processing noise subtraction
US8898056B2 (en) 2006-03-01 2014-11-25 Qualcomm Incorporated System and method for generating a separated signal by reordering frequency components
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
KR20090123921A (ko) * 2007-02-26 2009-12-02 퀄컴 인코포레이티드 신호 분리를 위한 시스템, 방법 및 장치
US8160273B2 (en) * 2007-02-26 2012-04-17 Erik Visser Systems, methods, and apparatus for signal separation using data driven techniques
US8068620B2 (en) * 2007-03-01 2011-11-29 Canon Kabushiki Kaisha Audio processing apparatus
US20110035215A1 (en) * 2007-08-28 2011-02-10 Haim Sompolinsky Method, device and system for speech recognition
JP5642339B2 (ja) * 2008-03-11 2014-12-17 トヨタ自動車株式会社 信号分離装置及び信号分離方法
US8321214B2 (en) * 2008-06-02 2012-11-27 Qualcomm Incorporated Systems, methods, and apparatus for multichannel signal amplitude balancing
WO2009151578A2 (en) * 2008-06-09 2009-12-17 The Board Of Trustees Of The University Of Illinois Method and apparatus for blind signal recovery in noisy, reverberant environments
US20100057472A1 (en) * 2008-08-26 2010-03-04 Hanks Zeng Method and system for frequency compensation in an audio codec
KR101178801B1 (ko) * 2008-12-09 2012-08-31 한국전자통신연구원 음원분리 및 음원식별을 이용한 음성인식 장치 및 방법
JP5071346B2 (ja) * 2008-10-24 2012-11-14 ヤマハ株式会社 雑音抑圧装置及び雑音抑圧方法
KR101648203B1 (ko) * 2008-12-23 2016-08-12 코닌클리케 필립스 엔.브이. 스피치 캡처링 및 스피치 렌더링
US9064499B2 (en) * 2009-02-13 2015-06-23 Nec Corporation Method for processing multichannel acoustic signal, system therefor, and program
JP5605573B2 (ja) * 2009-02-13 2014-10-15 日本電気株式会社 多チャンネル音響信号処理方法、そのシステム及びプログラム
FR2945169B1 (fr) * 2009-04-29 2011-06-03 Commissariat Energie Atomique Methode d'identification d'un signal ofdm
EP2444966B1 (en) * 2009-06-19 2019-07-10 Fujitsu Limited Audio signal processing device and audio signal processing method
FR2948484B1 (fr) * 2009-07-23 2011-07-29 Parrot Procede de filtrage des bruits lateraux non-stationnaires pour un dispositif audio multi-microphone, notamment un dispositif telephonique "mains libres" pour vehicule automobile
KR101587844B1 (ko) * 2009-08-26 2016-01-22 삼성전자주식회사 마이크로폰의 신호 보상 장치 및 그 방법
US20110058676A1 (en) * 2009-09-07 2011-03-10 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dereverberation of multichannel signal
US20110125497A1 (en) * 2009-11-20 2011-05-26 Takahiro Unno Method and System for Voice Activity Detection
WO2011063830A1 (en) * 2009-11-24 2011-06-03 Nokia Corporation An apparatus
CA2781702C (en) * 2009-11-30 2017-03-28 Nokia Corporation An apparatus for processing audio and speech signals in an audio device
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
US8718290B2 (en) * 2010-01-26 2014-05-06 Audience, Inc. Adaptive noise reduction using level cues
JP5489778B2 (ja) * 2010-02-25 2014-05-14 キヤノン株式会社 情報処理装置およびその処理方法
JP2013521576A (ja) 2010-02-28 2013-06-10 オスターハウト グループ インコーポレイテッド 対話式ヘッド取付け型アイピース上での地域広告コンテンツ
US10180572B2 (en) 2010-02-28 2019-01-15 Microsoft Technology Licensing, Llc AR glasses with event and user action control of external applications
US9097890B2 (en) 2010-02-28 2015-08-04 Microsoft Technology Licensing, Llc Grating in a light transmissive illumination system for see-through near-eye display glasses
US9366862B2 (en) 2010-02-28 2016-06-14 Microsoft Technology Licensing, Llc System and method for delivering content to a group of see-through near eye display eyepieces
US9097891B2 (en) 2010-02-28 2015-08-04 Microsoft Technology Licensing, Llc See-through near-eye display glasses including an auto-brightness control for the display brightness based on the brightness in the environment
US9129295B2 (en) 2010-02-28 2015-09-08 Microsoft Technology Licensing, Llc See-through near-eye display glasses with a fast response photochromic film system for quick transition from dark to clear
US9759917B2 (en) 2010-02-28 2017-09-12 Microsoft Technology Licensing, Llc AR glasses with event and sensor triggered AR eyepiece interface to external devices
US9285589B2 (en) 2010-02-28 2016-03-15 Microsoft Technology Licensing, Llc AR glasses with event and sensor triggered control of AR eyepiece applications
US9134534B2 (en) 2010-02-28 2015-09-15 Microsoft Technology Licensing, Llc See-through near-eye display glasses including a modular image source
US20150309316A1 (en) 2011-04-06 2015-10-29 Microsoft Technology Licensing, Llc Ar glasses with predictive control of external device based on event input
US9229227B2 (en) 2010-02-28 2016-01-05 Microsoft Technology Licensing, Llc See-through near-eye display glasses with a light transmissive wedge shaped illumination system
US9091851B2 (en) 2010-02-28 2015-07-28 Microsoft Technology Licensing, Llc Light control in head mounted displays
US20120249797A1 (en) 2010-02-28 2012-10-04 Osterhout Group, Inc. Head-worn adaptive display
US9128281B2 (en) 2010-09-14 2015-09-08 Microsoft Technology Licensing, Llc Eyepiece with uniformly illuminated reflective display
US9182596B2 (en) 2010-02-28 2015-11-10 Microsoft Technology Licensing, Llc See-through near-eye display glasses with the optical assembly including absorptive polarizers or anti-reflective coatings to reduce stray light
US9341843B2 (en) 2010-02-28 2016-05-17 Microsoft Technology Licensing, Llc See-through near-eye display glasses with a small scale image source
US9223134B2 (en) 2010-02-28 2015-12-29 Microsoft Technology Licensing, Llc Optical imperfections in a light transmissive illumination system for see-through near-eye display glasses
US8958572B1 (en) * 2010-04-19 2015-02-17 Audience, Inc. Adaptive noise cancellation for multi-microphone systems
US8538035B2 (en) 2010-04-29 2013-09-17 Audience, Inc. Multi-microphone robust noise suppression
US8473287B2 (en) 2010-04-19 2013-06-25 Audience, Inc. Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
US9165567B2 (en) 2010-04-22 2015-10-20 Qualcomm Incorporated Systems, methods, and apparatus for speech feature detection
US8781137B1 (en) 2010-04-27 2014-07-15 Audience, Inc. Wind noise detection and suppression
US9378754B1 (en) * 2010-04-28 2016-06-28 Knowles Electronics, Llc Adaptive spatial classifier for multi-microphone systems
WO2011140110A1 (en) * 2010-05-03 2011-11-10 Aliphcom, Inc. Wind suppression/replacement component for use with electronic systems
US9558755B1 (en) * 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
US9053697B2 (en) 2010-06-01 2015-06-09 Qualcomm Incorporated Systems, methods, devices, apparatus, and computer program products for audio equalization
US8447596B2 (en) 2010-07-12 2013-05-21 Audience, Inc. Monaural noise suppression based on computational auditory scene analysis
JP5732937B2 (ja) * 2010-09-08 2015-06-10 ヤマハ株式会社 サウンドマスキング装置
US9100734B2 (en) * 2010-10-22 2015-08-04 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for far-field multi-source tracking and separation
US9552840B2 (en) * 2010-10-25 2017-01-24 Qualcomm Incorporated Three-dimensional sound capturing and reproducing with multi-microphones
US9031256B2 (en) 2010-10-25 2015-05-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for orientation-sensitive recording control
US8855341B2 (en) 2010-10-25 2014-10-07 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for head tracking based on recorded sound signals
US8898058B2 (en) 2010-10-25 2014-11-25 Qualcomm Incorporated Systems, methods, and apparatus for voice activity detection
US20120128168A1 (en) * 2010-11-18 2012-05-24 Texas Instruments Incorporated Method and apparatus for noise and echo cancellation for two microphone system subject to cross-talk
EP2661905B1 (en) 2011-01-05 2020-08-12 Koninklijke Philips N.V. An audio system and method of operation therefor
US8989402B2 (en) * 2011-01-19 2015-03-24 Broadcom Corporation Use of sensors for noise suppression in a mobile communication device
WO2012107561A1 (en) * 2011-02-10 2012-08-16 Dolby International Ab Spatial adaptation in multi-microphone sound capture
US8929564B2 (en) * 2011-03-03 2015-01-06 Microsoft Corporation Noise adaptive beamforming for microphone arrays
US8942382B2 (en) * 2011-03-22 2015-01-27 Mh Acoustics Llc Dynamic beamformer processing for acoustic echo cancellation in systems with high acoustic coupling
FR2976111B1 (fr) * 2011-06-01 2013-07-05 Parrot Equipement audio comprenant des moyens de debruitage d'un signal de parole par filtrage a delai fractionnaire, notamment pour un systeme de telephonie "mains libres"
US9666206B2 (en) * 2011-08-24 2017-05-30 Texas Instruments Incorporated Method, system and computer program product for attenuating noise in multiple time frames
US20130054233A1 (en) * 2011-08-24 2013-02-28 Texas Instruments Incorporated Method, System and Computer Program Product for Attenuating Noise Using Multiple Channels
TWI459381B (zh) 2011-09-14 2014-11-01 Ind Tech Res Inst 語音增強方法
JP6179081B2 (ja) * 2011-09-15 2017-08-16 株式会社Jvcケンウッド ノイズ低減装置、音声入力装置、無線通信装置、およびノイズ低減方法
US9966088B2 (en) * 2011-09-23 2018-05-08 Adobe Systems Incorporated Online source separation
US8712769B2 (en) 2011-12-19 2014-04-29 Continental Automotive Systems, Inc. Apparatus and method for noise removal by spectral smoothing
WO2013093569A1 (en) * 2011-12-23 2013-06-27 Nokia Corporation Audio processing for mono signals
DE102012200745B4 (de) * 2012-01-19 2014-05-28 Siemens Medical Instruments Pte. Ltd. Verfahren und Hörvorrichtung zum Schätzen eines Bestandteils der eigenen Stimme
US8712076B2 (en) 2012-02-08 2014-04-29 Dolby Laboratories Licensing Corporation Post-processing including median filtering of noise suppression gains
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
KR101641448B1 (ko) * 2012-03-16 2016-07-20 뉘앙스 커뮤니케이션즈, 인코포레이티드 사용자 전용 자동 음성 인식
CN102646418B (zh) * 2012-03-29 2014-07-23 北京华夏电通科技股份有限公司 一种远程音频交互的多路声学回音消除方法及系统
EP2847914B1 (en) * 2012-05-07 2019-08-21 Assia Spe, Llc Apparatus and method for impulse noise detection and mitigation
US20130315402A1 (en) * 2012-05-24 2013-11-28 Qualcomm Incorporated Three-dimensional sound compression and over-the-air transmission during a call
US9881616B2 (en) 2012-06-06 2018-01-30 Qualcomm Incorporated Method and systems having improved speech recognition
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
CN102969000B (zh) * 2012-12-04 2014-10-22 中国科学院自动化研究所 一种多通道语音增强方法
WO2014097114A1 (en) * 2012-12-17 2014-06-26 Koninklijke Philips N.V. Sleep apnea diagnosis system and method of generating information using non-obtrusive audio analysis
US20140184796A1 (en) * 2012-12-27 2014-07-03 Motorola Solutions, Inc. Method and apparatus for remotely controlling a microphone
US9692379B2 (en) * 2012-12-31 2017-06-27 Spreadtrum Communications (Shanghai) Co., Ltd. Adaptive audio capturing
CN104010265A (zh) 2013-02-22 2014-08-27 杜比实验室特许公司 音频空间渲染设备及方法
US20140278380A1 (en) * 2013-03-14 2014-09-18 Dolby Laboratories Licensing Corporation Spectral and Spatial Modification of Noise Captured During Teleconferencing
US9467777B2 (en) * 2013-03-15 2016-10-11 Cirrus Logic, Inc. Interface for a digital microphone array
US9788119B2 (en) 2013-03-20 2017-10-10 Nokia Technologies Oy Spatial audio apparatus
KR102094392B1 (ko) * 2013-04-02 2020-03-27 삼성전자주식회사 복수의 마이크로폰들을 구비하는 사용자 기기 및 그 동작 방법
US20180317019A1 (en) 2013-05-23 2018-11-01 Knowles Electronics, Llc Acoustic activity detecting microphone
KR102282366B1 (ko) * 2013-06-03 2021-07-27 삼성전자주식회사 음성 향상 방법 및 그 장치
US9357080B2 (en) * 2013-06-04 2016-05-31 Broadcom Corporation Spatial quiescence protection for multi-channel acoustic echo cancellation
JP2015052466A (ja) * 2013-09-05 2015-03-19 株式会社デンソー 車両用装置及び音声切換制御プログラム
CN104424953B (zh) 2013-09-11 2019-11-01 华为技术有限公司 语音信号处理方法与装置
WO2015047308A1 (en) * 2013-09-27 2015-04-02 Nuance Communications, Inc. Methods and apparatus for robust speaker activity detection
US9392353B2 (en) * 2013-10-18 2016-07-12 Plantronics, Inc. Headset interview mode
US10536773B2 (en) 2013-10-30 2020-01-14 Cerence Operating Company Methods and apparatus for selective microphone signal combining
ITTO20130901A1 (it) * 2013-11-05 2015-05-06 St Microelectronics Srl Interfaccia di espansione dell'intervallo dinamico di un segnale di ingresso, in particolare di un segnale audio di un trasduttore acustico a due strutture di rilevamento, e relativo metodo
GB2520029A (en) 2013-11-06 2015-05-13 Nokia Technologies Oy Detection of a microphone
WO2015141103A1 (ja) * 2014-03-17 2015-09-24 日本電気株式会社 信号処理装置、信号処理方法、および信号処理プログラム
CN105981412B (zh) * 2014-03-21 2019-05-24 华为技术有限公司 一种估计总体混合时间的装置和方法
CN105096961B (zh) * 2014-05-06 2019-02-01 华为技术有限公司 语音分离方法和装置
US10149047B2 (en) * 2014-06-18 2018-12-04 Cirrus Logic Inc. Multi-aural MMSE analysis techniques for clarifying audio signals
US20150381333A1 (en) * 2014-06-26 2015-12-31 Harris Corporation Novel approach for enabling mixed mode behavior using microphone placement on radio terminal hardware
US10062374B2 (en) * 2014-07-18 2018-08-28 Nuance Communications, Inc. Methods and apparatus for training a transformation component
WO2016016387A1 (en) * 2014-07-31 2016-02-04 Koninklijke Kpn N.V. Noise suppression system and method
CN104134440B (zh) * 2014-07-31 2018-05-08 百度在线网络技术(北京)有限公司 用于便携式终端的语音检测方法和语音检测装置
CN106797512B (zh) 2014-08-28 2019-10-25 美商楼氏电子有限公司 多源噪声抑制的方法、系统和非瞬时计算机可读存储介质
DE112015004185T5 (de) 2014-09-12 2017-06-01 Knowles Electronics, Llc Systeme und Verfahren zur Wiederherstellung von Sprachkomponenten
DE112016000287T5 (de) 2015-01-07 2017-10-05 Knowles Electronics, Llc Verwendung von digitalen Mikrofonen zur Niedrigleistung-Schlüsselworterkennung und Rauschunterdrückung
US9668048B2 (en) 2015-01-30 2017-05-30 Knowles Electronics, Llc Contextual switching of microphones
CN104952459B (zh) * 2015-04-29 2018-05-15 大连理工大学 一种基于分布式一致性和mvdr波束形成的分布式语音增强方法
US9554207B2 (en) 2015-04-30 2017-01-24 Shure Acquisition Holdings, Inc. Offset cartridge microphones
US9565493B2 (en) 2015-04-30 2017-02-07 Shure Acquisition Holdings, Inc. Array microphone system and method of assembling the same
US9736578B2 (en) 2015-06-07 2017-08-15 Apple Inc. Microphone-based orientation sensors and related techniques
US9558731B2 (en) * 2015-06-15 2017-01-31 Blackberry Limited Headphones using multiplexed microphone signals to enable active noise cancellation
US9734845B1 (en) * 2015-06-26 2017-08-15 Amazon Technologies, Inc. Mitigating effects of electronic audio sources in expression detection
WO2017007848A1 (en) 2015-07-06 2017-01-12 Dolby Laboratories Licensing Corporation Estimation of reverberant energy component from active audio source
WO2017038462A1 (ja) * 2015-08-31 2017-03-09 ソニー株式会社 受信装置、および受信方法、並びにプログラム
US9401158B1 (en) * 2015-09-14 2016-07-26 Knowles Electronics, Llc Microphone signal fusion
US10013996B2 (en) * 2015-09-18 2018-07-03 Qualcomm Incorporated Collaborative audio processing
US9875081B2 (en) 2015-09-21 2018-01-23 Amazon Technologies, Inc. Device selection for providing a response
US10186276B2 (en) * 2015-09-25 2019-01-22 Qualcomm Incorporated Adaptive noise suppression for super wideband music
US10152977B2 (en) * 2015-11-20 2018-12-11 Qualcomm Incorporated Encoding of multiple audio signals
CN105529034A (zh) * 2015-12-23 2016-04-27 北京奇虎科技有限公司 一种基于混响的语音识别方法和装置
US11234072B2 (en) 2016-02-18 2022-01-25 Dolby Laboratories Licensing Corporation Processing of microphone signals for spatial playback
CN105825865B (zh) * 2016-03-10 2019-09-27 福州瑞芯微电子股份有限公司 噪声环境下的回声消除方法及系统
CN105848061B (zh) * 2016-03-30 2021-04-13 联想(北京)有限公司 一种控制方法及电子设备
US10249305B2 (en) * 2016-05-19 2019-04-02 Microsoft Technology Licensing, Llc Permutation invariant training for talker-independent multi-talker speech separation
CN107564512B (zh) * 2016-06-30 2020-12-25 展讯通信(上海)有限公司 语音活动侦测方法及装置
US10045110B2 (en) * 2016-07-06 2018-08-07 Bragi GmbH Selective sound field environment processing system and method
CN106328156B (zh) * 2016-08-22 2020-02-18 华南理工大学 一种音视频信息融合的麦克风阵列语音增强系统及方法
CN106548783B (zh) * 2016-12-09 2020-07-14 西安Tcl软件开发有限公司 语音增强方法、装置及智能音箱、智能电视
CN106782591B (zh) * 2016-12-26 2021-02-19 惠州Tcl移动通信有限公司 一种在背景噪音下提高语音识别率的装置及其方法
KR102423744B1 (ko) * 2016-12-30 2022-07-21 하만 베커 오토모티브 시스템즈 게엠베하 음향 반향 제거
US10367948B2 (en) 2017-01-13 2019-07-30 Shure Acquisition Holdings, Inc. Post-mixing acoustic echo cancellation systems and methods
US10554822B1 (en) * 2017-02-28 2020-02-04 SoliCall Ltd. Noise removal in call centers
KR101811635B1 (ko) 2017-04-27 2018-01-25 경상대학교산학협력단 스테레오 채널 잡음 제거 장치 및 방법
WO2018211806A1 (ja) * 2017-05-19 2018-11-22 株式会社オーディオテクニカ 音声信号処理装置
CN107360496B (zh) * 2017-06-13 2023-05-12 东南大学 可根据环境自动调节音量的扬声器系统及调节方法
EP3422736B1 (en) 2017-06-30 2020-07-29 GN Audio A/S Pop noise reduction in headsets having multiple microphones
US10482904B1 (en) 2017-08-15 2019-11-19 Amazon Technologies, Inc. Context driven device arbitration
JP6345327B1 (ja) * 2017-09-07 2018-06-20 ヤフー株式会社 音声抽出装置、音声抽出方法および音声抽出プログラム
US20190090052A1 (en) * 2017-09-20 2019-03-21 Knowles Electronics, Llc Cost effective microphone array design for spatial filtering
CN107785029B (zh) * 2017-10-23 2021-01-29 科大讯飞股份有限公司 目标语音检测方法及装置
WO2019112468A1 (en) * 2017-12-08 2019-06-13 Huawei Technologies Co., Ltd. Multi-microphone noise reduction method, apparatus and terminal device
US10998617B2 (en) * 2018-01-05 2021-05-04 Byton Limited In-vehicle telematics blade array and methods for using the same
US10657981B1 (en) * 2018-01-19 2020-05-19 Amazon Technologies, Inc. Acoustic echo cancellation with loudspeaker canceling beamformer
US10706842B2 (en) * 2018-01-23 2020-07-07 Google Llc Selective adaptation and utilization of noise reduction technique in invocation phrase detection
US10755728B1 (en) * 2018-02-27 2020-08-25 Amazon Technologies, Inc. Multichannel noise cancellation using frequency domain spectrum masking
US10957337B2 (en) 2018-04-11 2021-03-23 Microsoft Technology Licensing, Llc Multi-microphone speech separation
CN108766456B (zh) * 2018-05-22 2020-01-07 出门问问信息科技有限公司 一种语音处理方法及装置
US11523212B2 (en) 2018-06-01 2022-12-06 Shure Acquisition Holdings, Inc. Pattern-forming microphone array
US11297423B2 (en) 2018-06-15 2022-04-05 Shure Acquisition Holdings, Inc. Endfire linear array microphone
CN108718402B (zh) * 2018-08-14 2021-04-13 四川易为智行科技有限公司 视频会议管理方法及装置
CN108986833A (zh) * 2018-08-21 2018-12-11 广州市保伦电子有限公司 基于麦克风阵列的拾音方法、系统、电子设备及存储介质
US11310596B2 (en) 2018-09-20 2022-04-19 Shure Acquisition Holdings, Inc. Adjustable lobe shape for array microphones
CN109410978B (zh) * 2018-11-06 2021-11-09 北京如布科技有限公司 一种语音信号分离方法、装置、电子设备及存储介质
US11195540B2 (en) * 2019-01-28 2021-12-07 Cirrus Logic, Inc. Methods and apparatus for an adaptive blocking matrix
CN109767783B (zh) * 2019-02-15 2021-02-02 深圳市汇顶科技股份有限公司 语音增强方法、装置、设备及存储介质
US11049509B2 (en) * 2019-03-06 2021-06-29 Plantronics, Inc. Voice signal enhancement for head-worn audio devices
US11955138B2 (en) * 2019-03-15 2024-04-09 Advanced Micro Devices, Inc. Detecting voice regions in a non-stationary noisy environment
US11438691B2 (en) 2019-03-21 2022-09-06 Shure Acquisition Holdings, Inc. Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition functionality
US11558693B2 (en) 2019-03-21 2023-01-17 Shure Acquisition Holdings, Inc. Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition and voice activity detection functionality
WO2020191354A1 (en) 2019-03-21 2020-09-24 Shure Acquisition Holdings, Inc. Housings and associated design features for ceiling array microphones
TW202101422A (zh) 2019-05-23 2021-01-01 美商舒爾獲得控股公司 可操縱揚聲器陣列、系統及其方法
EP3977449A1 (en) 2019-05-31 2022-04-06 Shure Acquisition Holdings, Inc. Low latency automixer integrated with voice and noise activity detection
GB2585086A (en) * 2019-06-28 2020-12-30 Nokia Technologies Oy Pre-processing for automatic speech recognition
KR102226132B1 (ko) * 2019-07-23 2021-03-09 엘지전자 주식회사 헤드셋 및 그의 구동 방법
US11297426B2 (en) 2019-08-23 2022-04-05 Shure Acquisition Holdings, Inc. One-dimensional array microphone with improved directivity
CN110992967A (zh) * 2019-12-27 2020-04-10 苏州思必驰信息科技有限公司 一种语音信号处理方法、装置、助听器及存储介质
US11552611B2 (en) 2020-02-07 2023-01-10 Shure Acquisition Holdings, Inc. System and method for automatic adjustment of reference gain
USD944776S1 (en) 2020-05-05 2022-03-01 Shure Acquisition Holdings, Inc. Audio device
KR20210142268A (ko) * 2020-05-18 2021-11-25 주식회사 엠피웨이브 강인음성인식을 위한 방향벡터 추정을 겸한 온라인 우도최대화를 이용한 빔포밍 방법 및 그 장치
WO2021243368A2 (en) 2020-05-29 2021-12-02 Shure Acquisition Holdings, Inc. Transducer steering and configuration systems and methods using a local positioning system
US11632782B2 (en) * 2020-06-29 2023-04-18 Qualcomm Incorporated Spatial filters in full duplex mode
CN113949978A (zh) * 2020-07-17 2022-01-18 通用微(深圳)科技有限公司 声音采集装置、声音处理设备及方法、装置、存储介质
CN113949979A (zh) * 2020-07-17 2022-01-18 通用微(深圳)科技有限公司 声音采集装置、声音处理设备及方法、装置、存储介质
CN116918351A (zh) 2021-01-28 2023-10-20 舒尔获得控股公司 混合音频波束成形系统
CA3228068A1 (en) * 2021-10-12 2023-04-20 Christopher Charles NIGHMAN Multi-source audio processing systems and methods
CN114528525B (zh) * 2022-01-11 2023-03-28 西南交通大学 基于最大重加权峭度盲解卷积的机械故障诊断方法
CN114550734A (zh) * 2022-03-02 2022-05-27 上海又为智能科技有限公司 音频增强方法和装置、计算机存储介质
GB2622386A (en) * 2022-09-14 2024-03-20 Nokia Technologies Oy Apparatus, methods and computer programs for spatial processing audio scenes
CN116825076B (zh) * 2023-08-29 2023-11-07 荣耀终端有限公司 语音通话降噪方法、电子设备及可读存储介质

Family Cites Families (80)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4649505A (en) * 1984-07-02 1987-03-10 General Electric Company Two-input crosstalk-resistant adaptive noise canceller
US4912767A (en) * 1988-03-14 1990-03-27 International Business Machines Corporation Distributed noise cancellation system
US5327178A (en) * 1991-06-17 1994-07-05 Mcmanigal Scott P Stereo speakers mounted on head
US5208786A (en) * 1991-08-28 1993-05-04 Massachusetts Institute Of Technology Multi-channel signal separation
JPH05316587A (ja) * 1992-05-08 1993-11-26 Sony Corp マイクロホン装置
US5251263A (en) * 1992-05-22 1993-10-05 Andrea Electronics Corporation Adaptive noise cancellation and speech enhancement system and apparatus therefor
US5732143A (en) * 1992-10-29 1998-03-24 Andrea Electronics Corp. Noise cancellation apparatus
US5383164A (en) * 1993-06-10 1995-01-17 The Salk Institute For Biological Studies Adaptive system for broadband multisignal discrimination in a channel with reverberation
US5375174A (en) * 1993-07-28 1994-12-20 Noise Cancellation Technologies, Inc. Remote siren headset
JP3146804B2 (ja) 1993-11-05 2001-03-19 松下電器産業株式会社 アレイマイクロホンおよびその感度補正装置
US5706402A (en) * 1994-11-29 1998-01-06 The Salk Institute For Biological Studies Blind signal processing system employing information maximization to recover unknown signals through unsupervised minimization of output redundancy
US6002776A (en) * 1995-09-18 1999-12-14 Interval Research Corporation Directional acoustic signal processor and method therefor
US5770841A (en) * 1995-09-29 1998-06-23 United Parcel Service Of America, Inc. System and method for reading package information
US5675659A (en) * 1995-12-12 1997-10-07 Motorola Methods and apparatus for blind separation of delayed and filtered sources
US6130949A (en) * 1996-09-18 2000-10-10 Nippon Telegraph And Telephone Corporation Method and apparatus for separation of source, program recorded medium therefor, method and apparatus for detection of sound source zone, and program recorded medium therefor
WO1998017046A1 (en) * 1996-10-17 1998-04-23 Andrea Electronics Corporation Noise cancelling acoustical improvement to wireless telephone or cellular phone
US5999567A (en) * 1996-10-31 1999-12-07 Motorola, Inc. Method for recovering a source signal from a composite signal and apparatus therefor
FR2759824A1 (fr) * 1997-02-18 1998-08-21 Philips Electronics Nv Systeme de separation de sources non stationnaires
US7072476B2 (en) * 1997-02-18 2006-07-04 Matech, Inc. Audio headset
US6496581B1 (en) * 1997-09-11 2002-12-17 Digisonix, Inc. Coupled acoustic echo cancellation system
US6167417A (en) * 1998-04-08 2000-12-26 Sarnoff Corporation Convolutive blind source separation using a multiple decorrelation method
DE19822021C2 (de) * 1998-05-15 2000-12-14 Siemens Audiologische Technik Hörgerät mit automatischem Mikrofonabgleich sowie Verfahren zum Betrieb eines Hörgerätes mit automatischem Mikrofonabgleich
US6654468B1 (en) * 1998-08-25 2003-11-25 Knowles Electronics, Llc Apparatus and method for matching the response of microphones in magnitude and phase
DE19849739C2 (de) 1998-10-28 2001-05-31 Siemens Audiologische Technik Adaptives Verfahren zur Korrektur der Mikrofone eines Richtmikrofonsystems in einem Hörgerät sowie Hörgerät
US6898612B1 (en) * 1998-11-12 2005-05-24 Sarnoff Corporation Method and system for on-line blind source separation
US6606506B1 (en) * 1998-11-19 2003-08-12 Albert C. Jones Personal entertainment and communication device
US6343268B1 (en) 1998-12-01 2002-01-29 Siemens Corporation Research, Inc. Estimator of independent sources from degenerate mixtures
DE19859174C1 (de) * 1998-12-21 2000-05-04 Max Planck Gesellschaft Verfahren und Vorrichtung zur Verarbeitung rauschbehafteter Schallsignale
US6381570B2 (en) * 1999-02-12 2002-04-30 Telogy Networks, Inc. Adaptive two-threshold method for discriminating noise from speech in a communication signal
JP2002540696A (ja) * 1999-03-19 2002-11-26 シーメンス アクチエンゲゼルシヤフト ノイズ音響に満ちた環境でのオーディオ信号の受信と処理のための方法
US6526148B1 (en) * 1999-05-18 2003-02-25 Siemens Corporate Research, Inc. Device and method for demixing signal mixtures using fast blind source separation technique based on delay and attenuation compensation, and for selecting channels for the demixed signals
US6424960B1 (en) 1999-10-14 2002-07-23 The Salk Institute For Biological Studies Unsupervised adaptation and classification of multiple classes and sources in blind signal separation
US6594367B1 (en) * 1999-10-25 2003-07-15 Andrea Electronics Corporation Super directional beamforming design and implementation
US6549630B1 (en) * 2000-02-04 2003-04-15 Plantronics, Inc. Signal expander with discrimination between close and distant acoustic source
US7155019B2 (en) * 2000-03-14 2006-12-26 Apherma Corporation Adaptive microphone matching in multi-microphone directional system
US20010038699A1 (en) * 2000-03-20 2001-11-08 Audia Technology, Inc. Automatic directional processing control for multi-microphone system
US8903737B2 (en) * 2000-04-25 2014-12-02 Accenture Global Service Limited Method and system for a wireless universal mobile product interface
US6879952B2 (en) * 2000-04-26 2005-04-12 Microsoft Corporation Sound source separation using convolutional mixing and a priori sound source knowledge
US20030179888A1 (en) * 2002-03-05 2003-09-25 Burnett Gregory C. Voice activity detection (VAD) devices and methods for use with noise suppression systems
US7027607B2 (en) * 2000-09-22 2006-04-11 Gn Resound A/S Hearing aid with adaptive microphone matching
US7471798B2 (en) * 2000-09-29 2008-12-30 Knowles Electronics, Llc Microphone array having a second order directional pattern
EP1356706A2 (en) * 2000-09-29 2003-10-29 Knowles Electronics, LLC Second order microphone array
JP4028680B2 (ja) * 2000-11-01 2007-12-26 インターナショナル・ビジネス・マシーンズ・コーポレーション 観測データから原信号を復元する信号分離方法、信号処理装置、モバイル端末装置、および記憶媒体
US6462664B1 (en) * 2000-11-20 2002-10-08 Koninklijke Philips Electronics N.V. Baby monitor, system, and method and control of remote devices
US7206418B2 (en) * 2001-02-12 2007-04-17 Fortemedia, Inc. Noise suppression for a wireless communication device
CA2436484C (en) * 2001-02-14 2008-01-22 Gentex Corporation Vehicle accessory microphone
CA2396832C (en) * 2001-05-23 2008-12-16 Phonak Ag Method of generating an electrical output signal and acoustical/electrical conversion system
US7123727B2 (en) * 2001-07-18 2006-10-17 Agere Systems Inc. Adaptive close-talking differential microphone array
US8098844B2 (en) * 2002-02-05 2012-01-17 Mh Acoustics, Llc Dual-microphone spatial noise suppression
AU2002309146A1 (en) * 2002-06-14 2003-12-31 Nokia Corporation Enhanced error concealment for spatial audio
WO2004025989A1 (en) * 2002-09-13 2004-03-25 Koninklijke Philips Electronics N.V. Calibrating a first and a second microphone
JP2006510069A (ja) 2002-12-11 2006-03-23 ソフトマックス,インク 改良型独立成分分析を使用する音声処理ためのシステムおよび方法
US7142682B2 (en) * 2002-12-20 2006-11-28 Sonion Mems A/S Silicon-based transducer for use in hearing instruments and listening devices
KR100480789B1 (ko) * 2003-01-17 2005-04-06 삼성전자주식회사 피드백 구조를 이용한 적응적 빔 형성방법 및 장치
EP1453348A1 (de) * 2003-02-25 2004-09-01 AKG Acoustics GmbH Selbstkalibrierung von Arraymikrofonen
DE10310579B4 (de) * 2003-03-11 2005-06-16 Siemens Audiologische Technik Gmbh Automatischer Mikrofonabgleich bei einem Richtmikrofonsystem mit wenigstens drei Mikrofonen
KR100486736B1 (ko) * 2003-03-31 2005-05-03 삼성전자주식회사 두개의 센서를 이용한 목적원별 신호 분리방법 및 장치
US7203323B2 (en) * 2003-07-25 2007-04-10 Microsoft Corporation System and process for calibrating a microphone array
US7424119B2 (en) * 2003-08-29 2008-09-09 Audio-Technica, U.S., Inc. Voice matching system for audio transducers
US7099821B2 (en) 2003-09-12 2006-08-29 Softmax, Inc. Separation of target acoustic signals in a multi-transducer arrangement
US7515721B2 (en) * 2004-02-09 2009-04-07 Microsoft Corporation Self-descriptive microphone array
KR100600313B1 (ko) 2004-02-26 2006-07-14 남승현 다중경로 다채널 혼합신호의 주파수 영역 블라인드 분리를 위한 방법 및 그 장치
US7415117B2 (en) * 2004-03-02 2008-08-19 Microsoft Corporation System and method for beamforming using a microphone array
US7688985B2 (en) * 2004-04-30 2010-03-30 Phonak Ag Automatic microphone matching
CN101027571B (zh) * 2004-09-23 2011-05-04 美商内数位科技公司 使用展频码的盲信号分离
DE602004015987D1 (de) * 2004-09-23 2008-10-02 Harman Becker Automotive Sys Mehrkanalige adaptive Sprachsignalverarbeitung mit Rauschunterdrückung
US7190308B2 (en) 2004-09-23 2007-03-13 Interdigital Technology Corporation Blind signal separation using signal path selection
US7826624B2 (en) * 2004-10-15 2010-11-02 Lifesize Communications, Inc. Speakerphone self calibration and beam forming
US7464029B2 (en) * 2005-07-22 2008-12-09 Qualcomm Incorporated Robust separation of speech signals in a noisy environment
JP4701931B2 (ja) * 2005-09-02 2011-06-15 日本電気株式会社 信号処理の方法及び装置並びにコンピュータプログラム
DE102005047047A1 (de) * 2005-09-30 2007-04-12 Siemens Audiologische Technik Gmbh Mikrofonkalibrierung bei einem RGSC-Beamformer
US7813923B2 (en) * 2005-10-14 2010-10-12 Microsoft Corporation Calibration based beamforming, non-linear adaptive filtering, and multi-sensor headset
JP2007156300A (ja) 2005-12-08 2007-06-21 Kobe Steel Ltd 音源分離装置、音源分離プログラム及び音源分離方法
JP4863713B2 (ja) * 2005-12-29 2012-01-25 富士通株式会社 雑音抑制装置、雑音抑制方法、及びコンピュータプログラム
CN1809105B (zh) * 2006-01-13 2010-05-12 北京中星微电子有限公司 适用于小型移动通信设备的双麦克语音增强方法及系统
WO2007100330A1 (en) 2006-03-01 2007-09-07 The Regents Of The University Of California Systems and methods for blind source signal separation
US8898056B2 (en) 2006-03-01 2014-11-25 Qualcomm Incorporated System and method for generating a separated signal by reordering frequency components
US20070244698A1 (en) * 2006-04-18 2007-10-18 Dugger Jeffery D Response-select null steering circuit
JP2007295085A (ja) * 2006-04-21 2007-11-08 Kobe Steel Ltd 音源分離装置及び音源分離方法
US20080175407A1 (en) * 2007-01-23 2008-07-24 Fortemedia, Inc. System and method for calibrating phase and gain mismatches of an array microphone

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8908883B2 (en) 2010-12-14 2014-12-09 National Chiao Tung University Microphone array structure able to reduce noise and improve speech quality and method thereof
TWI511126B (zh) * 2012-04-24 2015-12-01 Polycom Inc 麥克風系統及噪音消除方法
US9282405B2 (en) 2012-04-24 2016-03-08 Polycom, Inc. Automatic microphone muting of undesired noises by microphone arrays

Also Published As

Publication number Publication date
KR20100105700A (ko) 2010-09-29
US20090164212A1 (en) 2009-06-25
US8175291B2 (en) 2012-05-08
JP2011508533A (ja) 2011-03-10
WO2009086017A1 (en) 2009-07-09
KR101172180B1 (ko) 2012-08-07
CN101903948A (zh) 2010-12-01
EP2229678A1 (en) 2010-09-22
CN101903948B (zh) 2013-11-06
JP5479364B2 (ja) 2014-04-23

Similar Documents

Publication Publication Date Title
TW200939210A (en) Systems, methods, and apparatus for multi-microphone based speech enhancement
JP5628152B2 (ja) スペクトルコントラスト強調のためのシステム、方法、装置、およびコンピュータプログラム製品
US8488803B2 (en) Wind suppression/replacement component for use with electronic systems
KR101470262B1 (ko) 다중-마이크로폰 위치 선택적 프로세싱을 위한 시스템들, 방법들, 장치, 및 컴퓨터 판독가능 매체
US8452023B2 (en) Wind suppression/replacement component for use with electronic systems
US8724829B2 (en) Systems, methods, apparatus, and computer-readable media for coherence detection
CN102057427B (zh) 用于加强可懂度的方法和设备
US7464029B2 (en) Robust separation of speech signals in a noisy environment
JP5410603B2 (ja) マルチチャネル信号の位相ベースの処理のためのシステム、方法、装置、およびコンピュータ可読媒体
US8160273B2 (en) Systems, methods, and apparatus for signal separation using data driven techniques
US20110058676A1 (en) Systems, methods, apparatus, and computer-readable media for dereverberation of multichannel signal
CN102947878A (zh) 用于音频均衡的系统、方法、装置、设备和计算机程序产品
TW201030733A (en) Systems, methods, apparatus, and computer program products for enhanced active noise cancellation
CA2798282A1 (en) Wind suppression/replacement component for use with electronic systems
CN102282865A (zh) 用于电子系统的声学语音活动检测(avad)