TW201013640A - Systems, methods, apparatus, and computer program products for spectral contrast enhancement - Google Patents

Systems, methods, apparatus, and computer program products for spectral contrast enhancement Download PDF

Info

Publication number
TW201013640A
TW201013640A TW098118088A TW98118088A TW201013640A TW 201013640 A TW201013640 A TW 201013640A TW 098118088 A TW098118088 A TW 098118088A TW 98118088 A TW98118088 A TW 98118088A TW 201013640 A TW201013640 A TW 201013640A
Authority
TW
Taiwan
Prior art keywords
signal
speech signal
sub
processor
noise
Prior art date
Application number
TW098118088A
Other languages
English (en)
Inventor
Jeremy Toman
Hung-Chun Lin
Erik Visser
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of TW201013640A publication Critical patent/TW201013640A/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Description

201013640 六、發明說明: 【發明所屬之技術領域】 本揭不案係關於語音處理。 本專利申請案主張於2008年5月29日申請之題為 「SYSTEMS,METHODS,APPARATUS, AND COMPUTER PROGRAM PRODUCTS FOR IMPROVED SPECTRAL CONTRAST ENHANCEMENT OF SPEECH AUDIO IN A DUAL-MICROPHONE AUDIO DEVICE」的臨時申請案第 〇 61/057,187號(代理人案號080442卩1)之優先權,該臨時申 請案已讓與給其受讓人。 本專利申請案涉及Visser等人之於2008年11月24曰申請 之題為「SYSTEMS, METHODS, APPARATUS, AND COMPUTER PROGRAM PRODUCTS FOR ENHANCED INTELLIGIBILITY」的同在申請中之美國專利申請案第 12/277,283號(代理人案號08173 7)。 【先前技術】 ® 以前在安靜之辦公室或家庭環境中進行的許多活動現今 在像汽車、街道或咖啡館之聲音可變情景中進行。舉例而 •言,一人可希望使用話音通信頻道來與另一人進行通信。 -該頻道可(例如)由行動無線手機或頭戴式耳機、對講機、 雙向無線電、車載裝置或另一通信器件提供。因此,在使 用者由其他人包圍之環境中,在具有人們傾向於聚集之處 通常碰到的這種雜訊内容的情況下,相當大數量之話音通 信係使用行動器件(例如,手機及/或頭戴式耳機)來進行 140748.doc 201013640 的。此雜訊傾向於使電話會話之遠端處的使用者分心或感 到惱火。此外,許多標準自動化商業異動(例如,帳戶餘 額或股票報價檢查)使用基於話音辨識之資料查詢,且此 等系統之準確性可受到干擾雜訊的顯著妨礙。 對於通信發生於有雜訊環境中之應用而言,可希望將所 要語音信號與背景雜訊分離。可將雜訊界定為干擾所要信 號或以其他方式使所要信號降級之所有信號的組合。背景 雜訊可包括在聲環境内產生之眾多雜訊信號(諸如,其他 人之背景會話)以及自該等信號中之每一者產生的反射及 回響。除非將所要語音信號與背景雜訊分離,否則可能難 以使其使用為可靠且有效的。 有雜訊聲環境亦可傾向於料或以其他方錢得難以聽 到所要之再生音訊信號,諸如電話會話中之遠端信號。聲 環境可具有與由通信器件所正再生之遠端信號競爭的許多 非可控雜訊源。此雜訊可引起令人不滿意之通信體驗。除 非可將遠端心號與背景雜訊區射4,否貝4可能難以使其使 用為可靠且有效的。 【發明内容】 ㈣-通用組態’-種處理語音信號之方法包括使用經 組態以處理音訊信號之—器件來對—多頻道感測音訊信號 執行-空間選擇性處理操作以產出一源信號及一雜訊參 考,且對該語音信號執行„_頻譜對比加強操作以產出一經 處理語音信號。在此種方法中,執行頻譜對比加強操作包 括基於來自雜訊參考之資訊來計算複數個雜訊副頻帶功率 140748.doc 201013640 估什,基於來自該語音信號之資訊來產生一加強向量丨及 基於該複數個雜訊副頻帶功率估計、來自該語音信號之資 訊及來自該加強向量之資訊來產出該經處理語音信號。在 此種方法中,该經處理語音信號之複數個頻率副頻帶中之 每一者係基於該語音信號之一相應頻率副頻帶。 根據一通用組態,一種用於處理語音信號之裝置包括用 於對一多頻道感測音訊信號執行一空間選擇性處理操作以 產出一源信號及一雜訊參考的構件及用於對該語音信號執 行-頻譜對比加強操作以產出—經處理語音信號的構件。 用於對該語音信號執行㈣對比加強操作之該構件包括用 於基於來自雜訊參考之資訊來計算複數個雜訊副頻帶功率 估計的構件;用於基於來自該語音信號之資訊來產生一加 強向量的構件;及詩基於該複數個雜訊副頻帶功率估 計、來自該語音信號之資訊及來自該加強向量之資訊來產 出該經處理語音信號的構件。在此種裝置中,該經處理纽
音信號之複數個頻率副頻帶中之每一者係基於該語音信號 之一相應頻率副頻帶。 , 根據另-通用組態,-種用於處理語音信號之裝置包 括 工間選擇性處理濾波器,其經組態以對一多頻、首 測音訊信號執行-空間選擇性處理操作以產出—源作=及 -雜訊參考;及一頻譜對比加強器,其經組態以對二: 信號執行-頻譜對比加強操作以產出—經處理語音传^ 在此種裝置中,該頻譜對比加強器包括:一功率:二:罝 器,其經組態以基於來自雜訊參考之資訊來計算複數個雜 140748.doc 201013640 讯δ’】頻帶功率估計;及—加強向量產生器,其經組態以基 於來自該語音信號之資訊來產生一加強向量。在此種裝置 中,該頻譜對比加強器經組態以基於該複數個雜訊副頻帶 功率估計、來自該語音信號之資訊及來自該加強向量之資 訊來產出該經處理語音信號。在此種裝置中,該經處理語 音信號之複數個頻率副頻帶中之每__者係、基於該語音信號 之一相應頻率副頻帶。 根據一通用態樣,一種電腦可讀媒體包括在由至少一處 理器執行時使該至少-處理器執行處理多頻道音訊信號之 方法的指令。此等指令包括在由—處理^執行時使該處理 器對一多頻道感測音訊信號執行一空間選擇性處理操作以 產出一源信號及一雜訊參考的指令;及在由一處理器執行 時使該處理器對該語音信號執行一頻譜對比加強操作以^ 出一經處理語音信號的指令。用以執行頻譜對比加強操作 之扣令包括用以基於來自雜訊參考之資訊來計算複數個雜 訊副頻帶功率估計的指令;用以基於來自該語音信號之資 訊來產生-加強向量的指令;及用以基於該複數個雜訊副 頻帶功率估計、來自該語音信號之資訊及來自該加強向; 之資訊來產出該經處理語音信號的指令。在此種方法中, 該經處理語音信號之複數個頻率副頻帶中之每一者係美於 該語音信號之一相應頻率副頻帶。 ' 根據一通用組態,一種處理 組態以處理音訊信號之一器件 滑化以獲得一第一平滑信號; 語音信號之方法包括使用經 來使該語音信號之一頻譜平 使該第一平滑信號平滑化以 140748.doc -6 - 201013640 獲得一第二平滑信號;且產屮一I# 咕 、 產出一基於該第一平滑信號及該 第二平滑信號之比率的對屮“改 的對比加強5吾音信號。亦揭示經組熊 以執行此種方法之裳詈,以s B 士上 乂及具有在由至少一處理器執行
時使該至少一處理_ L 〇執仃此種方法的指令的電腦可讀媒 體。 ' 【實施方式】 在行動環境中影響★五立^士& 曰 號之雜訊可包括各種不同分 ❹ 諸如競爭淡話者、音樂、串音、街道雜訊及/或飛機 場雜訊。由於此雜訊之特徵通常為非穩定的且接近於語音 信號之頻率特徵,所以可難以使用傳統單一麥克風或固定 束成形類i之方法來模擬該雜訊。單一麥克風雜訊減少 技術通顯著參數調諧(P_eter tuning)以達成最佳 效能。舉例而言,在此“ 隹此寻If况下,合適之雜訊參考可能會 為直接可用的,_g_可需要間接地導出雜訊參考。因此, 基於夕個麥克風之高級信號處理可希望支援在有雜訊環境 中使用行動器件進行^音通信。在—特定實例中在有雜 5裒兄中n gf音信號’且使用語音處理方法來將該語 音信號與環境雜訊(亦被稱作「背景雜訊」或「周圍雜 )'離在另一特定實例中,在有雜訊環境中再生一 -广號’且使用語音處理方法來將該語音信號與環境雜 s刀離⑺曰k號處理在日常通信之許多領域中為重要 的1為在真實世界條件巾幾傾是存在雜訊。 纽:使用如本文所描述之系統、方法及裝置來支援所感測 號及/或再生語音信號之增加可懂度,尤其在有雜 140748.doc 201013640 訊環境中。此等技術可大體上應用於任何記錄、音訊感 測、收發及/或音訊再生應用中,尤其此等應用之行動或 其他攜帶型例子。舉例而言,本文所揭示之組態範圍包括 駐留於經組態以使用一分碼多重存取(CDMA)無線介面之 無線電話通信系統中的通信器件。然而,熟習此項技術者 將理解具有如本文令所描述之特徵的方法及裝置可駐留於 使用熟習此項技術者所已知之廣泛範圍之技術的各種通信 系統中之任一者中,諸如經由有線及/或無線(例如’ CDMA、TDMA、FDMA、TD-SCDMA 或 OFDM)傳輸頻道 使用話音IP(「VoIP」)之系統。 除非受其上下文明確地限制,否則術語「信號」在本文 中用以指示其普通意義中之任一者,包括在導線、匯流排 或其他傳輸媒體上表示之一記憶體位置(或記憶體位置之 集合)的狀態《除非受其上下文明確地限制,否則術語 產生」在本文中用以指示其普通意義中之任一者,諸如 計算或以其他方式得到。除非受其上下文明確地限制,否 則術語「計算」在本文中用以指示其普通意義之任一者, 諸如計算、評估、平滑及/或自複數個值中進行選擇。時 非觉其上下文明確地限帝j ’否則術言吾「獲得」肖以指示其 普通意義中之任一者’諸如計算、導出、接收(例如,自 ^部器件)及/或擷取(例如,自儲存元件之陣列)。在術窝 「包含」用於本描述及申請專利範圍中時,其並不排除其 他元件或操作。術語「基於」(如在「A係基於b」中)用^ 私不其普通意義中之任一者’包括以下情況:⑴「導汪 140748.doc 201013640 自「」(例如’「B為A之先驅」);(ii)「至少基於」(例如, A至少基於B」)’及在特定情形下適當時,㈣ 於」(例如,「A等於B」)…類似地,術語「回應於」用 以指示其普通意義中之任一者,包括「至少回應於」。 除非另外指示’否則對具有特定特徵之裝置之操作的任 何揭示内容亦明確地意欲揭示具有類似特徵之方法(且反 =亦然Ο, 對根據特定组態之裝置之操作的任何揭示内
容亦明確地意欲揭示根據類似組態之方法(且反之亦然)。 如由其特定上下文所指示,術語「組態」可參考方法’、、、裝 置及/或系統來使用。除非由特定上下文另外指示,否則 一般地且可互換地使用術語「方法」、「過程」、「程序」及 「技術γ除非由特定上下文另外指示,否則亦一般地且 γ互換地使用術語「裝置」與「器件」。術語「元件」及 「模組j通常用以指示一較大組態之一部分。除非由其上 下文明確地限制,否則術語「系統」在本文中用以指示其 普通意義中之任一者,包括「互動以達成共同目標的一群 元件」。藉由引用文件之一部分而做出的任何併入亦應理 解為併入在該部分内提及之術語或變數的定義(其中此等 定義出現於文件中之別處)以及該併入部分中提及之任何 圖式® 可互換地使用術語「編碼器」、「編解碼器」及「編碼系 統」以表示一系統,該系統包括經組態以接收及編碼音訊 信號之訊框(可能在諸如感知加權及/或其他濾波操作之一 或多個預處理操作後)的至少一編碼器及經組態以接收該 140748.doc 201013640 等編碼訊框及產出該等訊框之相應解碼表示的一相應解碼 器。此種編碼器及解碼器通常部署於通信鏈路之相對終端 機處。為了支援全雙工通信,編碼器及解碼器兩者之例子 通常部署於此種鏈路之每一端處。 在此描述中,術語「所感測音訊信號」表示經由一或多 個麥克風接收到之信號。一音訊感測器件(諸如,通信或 記錄器件)可經組態以儲存一基於該所感測音訊信號的信 號及/或將此信號輸出至經由電線或用無線方式耦接至該 音訊感測器件的一或多個其他器件。 在此描述中,術語「再生音訊信號」表示由自儲存器擷 取或經由至另一器件之有線或無線連接接收到之資訊來再 生的仏號。一音訊再生器件(諸如,通信或播放器件)可經 組態以將再生音訊信號輸出至該器件之一或多個揚聲器。 或者,此種器件可經組態以將再生音訊信號輸出至耳承、 其他頭戴式耳機或經由電線或⑼線方式柄接至該器件的 外部揚聲器。參考用於話音通信之收發器應用(諸如,電 話)’所感測音訊信號為將由收發器傳輸之近端信號,且 再生音訊信號為由收發器接收到(例如,經由有線及/或無 線通信鏈路)之遠端信號。參考行動音訊再生應用(諸如了 所記錄音樂或語音(例如,MP3、音訊圖書、播客)之播放 或此内容之連續播送(stream)),再生音訊信號為所播放或 連續播送之音訊信號。 語音信號之可僅度可相對於該信號之頻譜特性來改變。 舉例而言,圖丨之清晰度指標曲線圓展示語音可懂度之相 140748.doc -10- 201013640 關組成如何隨著音訊頻率而改變。此曲線圖說明在1 kHz 與4 kHz之間的頻譜分量對於可懂度而言尤其重要,相關 重要峰值大約在2 kHz。 圖2展示經由一電話應用之典型窄頻帶頻道來傳輸及/或 接收的語音信號之功率譜。此圖說明此信號之能量在頻率 增加高於500 Hz時快速地減少。然而,如圖1所示,達4 kHz之頻率對於語音可懂度而言可為非常重要的。因此, 在500 Hz與4000 Hz之間的頻率頻帶中人工提昇能量可預 期改良此種電話應用中語音信號之可懂度。 由於高於4 kHz之音訊頻率通常不如1 kHz至4 kHz頻帶 對可懂度如此重要,所以經由一典型帶限通信頻道傳輸一 窄頻帶信號通常足以具有可明瞭之會話。然而,對於通信 頻道支援寬頻帶信號之傳輸的情況而言,可預期個人語音 特點之增加清晰性及更好通信《在話音電話情形中,術語 「窄頻帶」指代自約0 Hz至500 Hz(例如,0、50、1〇〇或 200 Hz)至約 3 kHz至 5 kHz(例如,3500、4000或 4500 Hz) 的頻率範圍,且術語「寬頻帶」指代自約〇 Hz至500 Hz(例 如,〇、50、100 或 200 Hz)至約 7 kHz 至 8 kHz(例如, 7000、7500或8000 Hz)的頻率範圍。 可希望藉由提昇一語音信號之選定部分來增加語音可懂 度。舉例而言,在助聽器應用中,可使用動態範圍壓縮技 術來藉由提昇再生音訊信號中之特定頻率副頻帶來補償彼 等副頻帶中之已知聽力損失。 真實世界充滿多個雜訊源(包括單點雜訊源),其通常侵 140748.doc 11 201013640 入多個聲音中造成回響。背景聲雜訊可包括由一般環境產 生之眾多雜訊信號及由其他人之背景會話產生之干擾信號 以及自該等信號中之每一者產生的反射及回響。 環境雜訊可影響所感測音訊信號(諸如,近端語音信號) 及/或再生音訊信號(諸如,遠端語音信號)之可懂度。對於 通信發生於有雜訊環境中之應用而言,可希望使用語音處 理方法來將語音信號與背景雜訊區別開且加強其可懂度。 此處理在日常通信之許多領域中可為重要的,因為在真實 世界條件中幾乎總是存在雜訊。 自動增益控制(AGC,亦被稱作自動音量控制或AVC)為 可用以增加在有雜訊環境中感測或再生的音訊信號之可,)·董 度的處理方法。可使用自動增益控制技術來將該信號之動 態範圍壓縮至有限振幅頻帶中,藉此提昇該信號之具有低 功率之區段及減少具有高功率之區段中之能量。圖3展示 典型語音功率譜(其中自然語音功率下降使功率隨頻率減 少)及典型雜訊功率譜(其中功率大體上在至少語音頻率範 圍内怪定)之實例。在此種情況下,語音信號之高頻率分 量可具有比雜訊信號之相應分量少的能量,導致對高頻率 語音頻帶的遮罩。圖4A說明AVc對此種實例之應用。如此 圖式中所示,通常實施一 AVC模組以無差別地提昇語音信 號之所有頻率頻帶◎此種方法可需要將放大信號之大動態 範圍用於南頻率功率之適度提昇。 較之低頻率内容’背景雜訊通常更快地淹沒高頻率語音 内合’因為高頻率頻帶中之語音功率通常遠小於低頻率頻 140748.doc 201013640 帶中之語音功率。因此’僅提昇信號之總音量將不必要地 提昇低於1 kHz之低頻率内容,此可不顯著地有助於可僅 度。可希望改為調整音頻副頻帶功率以補償對語音信號之 雜訊遮罩效應。舉例而言,可希望與雜訊語音副頻帶功率 之比率成反比且不相稱地提昇語音功率,使得在高頻率副 頻帶中朝著高頻率補償語音功率之固有下降。 可希望在由環境雜訊占主導之頻率副頻帶中補償低話音 功率。舉例而言,如圖4B所示,可希望對選定副頻帶起作 用以藉由將不同增益提昇應用於語音信號之不同副頻帶 (根據語音雜訊比率)來提昇可懂度。與圖4A所示之avc實 例對比,可預期此等化提供更清楚及更明瞭之信號,同時 避免對低頻率分量之不必要提昇。 為了以此種方式選擇性地提昇語音功率’可希望獲得對 環境雜訊位準之可靠且同時之估計。然而,在特定應用 中’可能難以使用傳統單一麥克風或固定波束成形類型之 ❹ 方法來由所感測音訊信號模擬環境雜訊。雖然圖3表明雜 訊位準隨頻率而恆定,但在通信器件或媒體播放器件之特 定應用中,環境雜訊位準通常隨時間及頻率而顯著且快速 地改變。 在一典型環境中,聲雜訊可包括串音雜訊、飛機場雜 訊、街道雜訊、競爭談話者之話音,及/或來自干擾源⑽ —電視機或收音機)的聲音。因此,此雜訊通常為非穩 疋,且可具有接近於使用者自身話音之頻譜的平均頻譜。 自單一麥克風信號計算出之雜訊功率參考信號通常僅為一 140748.doc -13· 201013640 近似穩定雜訊估計。此外,此計算通常必然伴有雜訊功率 估計延遲,使得可僅在顯著延遲後才執行對副頻帶增益之 相應調整。可希望獲得環境雜訊之可靠且同時之估計。 圖5展示根據一通用組態之經組態以處理音訊信號之裝 置八1〇〇的方塊圖,該裝置包括一空間選擇性處理濾波器 SS10及一頻譜對比加強器EN10。空間選擇性處理(ssp)濾 波器SS10經組態以對一 M頻道感測音訊信號si〇(其中M = 大於一之整數)執行空間選擇性處理操作以產出一源信號 S20及一雜訊參考S30。加強器EN1〇經組態以基於來自雜 訊參考S30之資訊來動態地更改語音信號S4〇之頻譜特性以 產出一經處理語音信號S50。舉例而言,加強SENi〇可經 組態以使用來自雜訊參考S30之資訊來相對於語音信號S4〇 之至少一頻率副頻帶來提昇語音信號S4〇之至少一其他頻 率副頻帶及/或使之衰減以產出經處理語音信號S5〇。 可實施裝置A100 ’使得語音信號S4〇為一再生音訊信號 (例如,遠端信號)。或者,可實施裝置A1〇〇,使得語音信 號S40為一所感測音訊信號(例如,近端信號)。舉例而 言,可實施裝置A1 00,使得語音信號S4〇基於多頻道感測 音訊信號S10。圖6A展示裝置A100之此實施例All〇的方塊 圖,其中加強器EN10經配置以將源信號S2〇作為語音信號 S40來接收。圖6B展示裝置A100(及裝置A11〇)之另一實施 例A120的方塊圖’實施例A120包括加強器EN10之兩個例 子EN 10a及EN1 Ob。在此實例中’加強器en l〇a經配置以處 理語音信號S40(例如,遠端信號)以產出經處理語音信號 140748.doc 201013640 S50a,且加強器EN10b經配置以處理源信號S2〇(例如,近 端信號)以產出經處理語音信號S5〇b。 在裝置A100之典型應用中,所感測音訊信號Si〇之每一 頻道係基於來自Μ個麥克風之陣列中之相應一者的信號, 八中Μ為具有大於一之值的整數。可經實施以包括具有此 麥克風陣列之裝置Α100實施例的音訊感測器件之實例包括 助聽器、通信器件、記錄器件及音訊或視聽播放器件。此 等通信器件之實例包括(不限於)電話機(例如,有接線或無 接線電話、蜂巢式電話手機、通用串列匯流排(usb)手 機)、有線及/或無線頭戴式耳機(例如,藍芽頭戴式耳 機),及免持車載裝置。此等記錄器件之實例包括(不限於) 手持型音訊及/或視訊記錄器及數位相機。此等音訊或視 聽播放器件之實例包括(不限於)經組態以再生連續播送或 預記錄之音訊或視聽内容的媒體播放器。可經實施以包括 具有此麥克風陣列之裝置A1〇〇實施例且可經組態以執行通 φ 信、記錄及/或音訊或視聽播放操作的音訊感測器件之其 他實例包括個人數位助理(PDA)及其他手持型計算器件; 小筆電(netbook)電腦、筆記型電腦、膝上型電腦及其他攜 帶型計算器件;及桌上型電腦及工作站。 可實施Μ個麥克風之陣列以具有經組態以接收聲信號的 兩個麥克風(例如,立體聲陣列)或兩個以上之麥克風。該 陣列中之每一麥克風可具有全向、雙向或單向(例如,心 形線)之響應。可使用之各種類型的麥克風包括(不限於)壓 電式麥克風、動圈式麥克風及駐極體麥克風。在用於攜帶 140748.doc -15· 201013640 型活音通彳s之器件(諸如,手機或頭戴式耳機)中,此陣列 中之相鄰麥克風之間的中心至中心間隔通常在約1 ·5 至 約4.5 cm之範圍中,但在諸如手機之器件中較大間隔(例 如,達10 cm或15 cm)亦為可能的。在助聽器中,此陣列 中之相鄰麥克風之間的中心至中心間隔可小如約4 mm或5 mm。此陣列中之麥克風可沿著一線配置,&替代地,使 得其中心位於二維(例如,三角形)或三維形狀之頂點處。 可希望藉由對由該陣列中之麥克風產出之信號執行一或 多個預處理操作來獲得所感測音訊信號S10。此等預處理 操作可包括取樣、瀘波(例如,關於回音消除、雜訊減 少、頻譜整形等等)及可能甚至預分離(例如,藉由如本文 所描述之另-SSP據ί皮器或適應性遽波器)以獲得所感測音 托仏號S10。對於諸如語音之聲應用而言,典型取樣速率 之範圍自8 1〇^至16 kHz。其他典型預處理操作包括類比 及/或數位域中之阻抗匹配、增益控制,及濾波。 二間選擇性處理(SSP)濾波器SS1 0經組態以對所感測音 訊信號S10執行空間選擇性處理操作以產出一源信號S20及 一雜訊參考S 3 0。此操作可經設計以判定該音訊感測器件 與一特定聲音源之間的距離、減少雜訊、加強自特定方向 到來之信號分量,及/或將一或多個聲音分量與其他環境 聲音分離。此等空間處理操作之實例描述於2〇〇8年8月乃
曰申請之題為「SYSTEMS,METHODS,AND APPARATUS FOR SIGNAL SEPARATION」的美國專利申請案第 12/197,924號及於2008年11月24日申請之題為「SYSTEMS, 140748.doc •16- 201013640 METHODS, APPARATUS, AND COMPUTER PROGRAM PRODUCTS FOR ENHANCED INTELLIGIBILITY」的美國 專利申請案第12/277,283號中且包括(不限於)波束成形及 盲源分離操作。雜訊分量之實例包括(不限於)漫射環境雜 訊(諸如,街道雜訊、汽車雜訊及/或串音雜訊)及方向性雜 訊(諸如,干擾揚聲器及/或來自諸如電視、收音機或公共 廣播系統之其他點源的聲音)。 空間選擇性處理濾波器SS10可經組態以將所感測音訊信 參 號S10之方向性所要分量(例如,使用者之話音)與該信號 之一或多個其他分量(諸如,方向性干擾分量及/或漫射雜 訊分量)分離。在此種情況下,SSP濾波器SS 10可經組態以 集中該方向性所要分量之能量,使得源信號S20包括比所 感測音訊信號S10之每一頻道包括的能量多的該方向性所 要分量之能量(亦即,使得源信號S20包括比所感測音訊信 號S 10之任何個別頻道包括的能量多的該方向性所要分量 之能量)。圖7展示SSP濾波器SS 10之此實例的波束圖形, 其表明濾波器響應相對於麥克風陣列之軸的方向性。 可使用空間選擇性處理濾波器S S 10來提供對環境雜訊之 可靠且同時之估計。在一些雜訊估計方法中,藉由對輸入 信號之無作用訊框(例如,僅含有背景雜訊或為寂靜之訊 框)求平均來估計雜訊參考。此等方法可能會對環境雜訊 之改變反應緩慢,且通常對於模擬非穩定雜訊(例如,脈 衝雜訊)為無效的。空間選擇性處理濾波器SS10可經組態 以將雜訊分量甚至自輸入信號之有作用訊框分離以提供雜 140748.doc 17 201013640 訊參考S30。藉由SSP濾波器SS10分離至此雜訊參考之訊 框中的雜訊可基本上與源信號S20之相應訊框中之資訊内 容同時’且此雜訊參考亦被稱作「即時」雜訊估計。 空間選擇性處理濾波器SS10通常經實施以包括由濾波器 係數值之一或多個矩陣表徵的一固定濾波器FF10。可使用 如下文更詳細描述之波束成形、盲源分離(BSS)或組合之 BSS/波束成形方法來獲得此等濾波器係數值。空間選擇性 處理濾'波器S S10亦可經實施以包括一個以上之級。圖8 a 展示SSP濾波器SS10之此實施例SS20的方塊圖,實施例 SS20包括一固定渡波器級FF10及一適應性渡波器級 AF10。在此實例中,固定濾波器級FF1〇經配置以對所感 測音訊信號S10之頻道S10-1及S10-2進行濾波以產出經濾 波信號S15之頻道S15-1及S15-2,且適應性濾波器級AF10 經配置以對頻道S15-1及S15-2進行濾波以產出源信號S20 及雜訊參考S30。在此種情況下,如下文更詳細地描述, 可希望使用固定濾波器級FF10來為適應性濾波器級AF10 產生初始條件。亦可希望對SSP濾波器SS10之輸入執行適 應性按比例調整(例如,以確保IIR固定或適應性濾波器組 之穩定性)。 在SSP濾波器SS20之另一實施例中,適應性濾波器AF10 經配置以將經濾波之頻道S1 5-1及所感測音訊頻道S1 0-2作 為輸入來接收。在此種情況下,可希望適應性濾波器AF10 經由匹配固定濾波器FF 10之預期處理延遲的延遲元件來接 收所感測音訊頻道S10-2。 140748.doc -18· 201013640 可希望實施SSP濾波器SS10以包括多個固定濾波器級, 其經配置使得可在操作期間選擇該等固定濾波器級中之適 當者(例如,根據各種固定濾波器級之相關分離效能)。此 結構揭示於(例如)於208年12月12日申請之題為「SYSTEMS, METHODS, AND APPARATUS FOR MULTI-MICROPHONE BASED SPEECH ENHANCEMENT」的美國專利申請案第 12/334,246號(代理人案號080426)中。 空間選擇性處理濾波器SS10可經組態以在時域中處理所 ❹ 感測音訊信號S10且產出源信號S20及雜訊參考S30作為時 域信號。或者,SSP濾波器SS10可經組態以在頻域(或另一 變換域)中接收所感測音訊信號S10或將所感測音訊信號 S10轉換至此域,且在彼域中處理所感測音訊信號S10。 可希望在SSP濾波器SS10或SS20後跟著一雜訊減少級, 該雜訊減少級經組態以應用雜訊參考S30以進一步減少源 信號S20中之雜訊。圖8B展示裝置A100之實施例A130的方 塊圖,實施例A130包括此雜訊減少級NR10。雜訊減少級 NR10可實施為文納濾波器,其濾波係數值係基於來自源 信號S20及雜訊參考S30之信號及雜訊功率資訊。在此種情 況下,雜訊減少級NR10可經實施以基於來自雜訊參考S30 之資訊來估計雜訊頻譜。或者,雜訊減少級NR10可經實 施以基於雜訊參考S30之頻譜來對源信號S20執行頻譜刪減 操作。或者,雜訊減少級NR10可實施為卡門濾波器’其 雜訊協方差係基於來自雜訊參考S30之資訊。 雜訊減少級NR10可經組態以在頻域(或另一變換域)中處 140748.doc -19- 201013640 理源號S20及雜訊參考§30。圖9A展示裝置Al3〇之實施 例A132的方塊圖,實施例八132包括雜訊減少級nr10之此 實施例NR20。裝置A132亦包括一變換模組TR10,其經組 態以將源信號S20及雜訊參考S30變換至變換域中。在典型 實例中’變換模組TR10經組態以對源信號S2〇及雜訊參考 S30中之每一者執行快速傅立葉變換(FFT)(諸如,U8點、 256點或5 12點FFT)以產出各別頻域信號。圖9B展示裝置 A13 2之實施例A13 4的方塊圖,實施例a 13 4亦包括一逆變 換模組TR20,·逆變換模组TR20經配置以將雜訊減少級 NR20之輸出變換至時域(例如,藉由對雜訊減少級NR2〇之 輸出執行逆FFT)。 雜訊減少級NR2〇可經組態以藉由根據雜訊參考s3〇之相 應頻格(b i η)的值來對源信號s 2 〇之頻域頻格進行加權來計 算雜訊減少語音信號S45。在此種情況下,雜訊減少級 NR20可經組態以根據諸如見山之表達式來產出雜訊減 少語音信號S45,其中^指示雜訊減少語音信號S45之第i 個頻格,Ai指示源信號S20之第丨個頻格,且%指示訊框之 權重向量之第:個元素。每一頻格可包括相應頻域信號之 僅—個值,或雜訊減少級NR20可經組態以根據所要副頻 帶劃分方案來將每一頻域信號之該等值聚合成多個頻格 (例如,如在下文參考頻格化(binning)模組SG30所描述)。 雜訊減少級NR20之此實施例可經組態以計算權重%, ,得該等權重對於雜訊參考S3〇具有低值之頻格而言為較 馬的(例如,較接近於一)及對於雜訊參考S3〇具有高值之 140748.doc 201013640
頻格而言為較低的(例如,較接近於零卜雜訊減少級取2〇 之-個此種實例經組態以藉由根據—表達式來計算權重W 中之每一者來阻斷源信號S20之頻格或使之通過,該表達 式諸如在頻格Ni中之值的總和(或者,平均值)小於(或者, =大於)臨限值Ti時為〒!且否則為〒〇。在此實例中,化 才曰不雜訊參考S30之第丨個頻格。可希望組態雜訊減少級 NR20之此實施例’使得臨限值Ti彼此相等,或替代地,使 得臨限值Ti中之至少兩者彼此不同。在另一實例中,雜訊 減少級NR20經組態以藉由在頻域中自源信號s2〇刪減去雜 訊參考S30(亦即,藉由自源信號S2〇之頻譜刪減去雜訊參 考S30之頻譜)來計算雜訊減少語音信號S45。 如下文更詳細地描述,加強器EN1〇可經組態以在頻域 或另一變換域中對一或多個信號執行操作。圖1〇A展示裝 置A100之實施例八14〇的方塊圖,實施例Ai4〇包括雜訊減 少級NR20之一例子。在此實例中,加強器EN1〇經配置以 將雜訊減少語音信號S45作為語音信號S4〇來接收,且加強 器EN10亦經配置以將雜訊參考s3〇及雜訊減少語音信號 S45作為變換域信號來接收。裝置A14〇亦包括逆變換模組 TR20之一例子,其經配置以將經處理語音信號S5〇自變換 域變換至時域。 明確地提到,對於語音信號S4〇具有高取樣速率(例如, 44.1 kHz或高於十千赫之另—取樣速率)之情況,可希望加 強器EN10藉由在時域中處理信號S4〇來產出一相應經處理 語音信號S50 ^舉例而言,可希望避免對此信號執行變換 140748.doc •21 - 201013640 操作之計算代價。自媒體檔案或檔案流再生之信號可具有 此取樣速率。 圖10B展示裝置A140之實施例八150的方塊圖。裝置A15〇 包括加強器EN10之一例子EN10a,其經組態以在變換域中 處理雜訊參考S30及雜訊減少語音信號S4S(例如,如上文 參考裝置A140所描述)以產出一第一經處理語音信號 S50a。裝置A150亦包括加強器EN10之一例子ENlOb,其經 組態以在時域中處理雜訊參考S3〇及語音信號S4〇(例如, 遠端或其他再生信號)以產出一第二經處理語音信號 S50b。 在經組態以執行方向性處理操作之替代例中,或除了經 組態以執行方向性處理操作外,SSP濾波器SS10可經組態 以執行一距離處理操作。圖11A及圖11B分別展示ssp濾波 器SS10之實施例SS110及SS120的方塊圖,該等實施例包括 經組態以執行此操作之一距離處理模組DS 1 〇。距離處理模 組DS10經組態以產出(作為距離處理操作之結果)一距離指 示信號DI1 0,該信號指示多頻道感測音訊信號s丨〇之一分 量的源相對於麥克風陣列的距離》距離處理模組DS1〇通常 經組態以產出距離指示信號DI10作為兩個狀態分別指示近 場源及遠場源的二元值指示信號,但產出連續及/或多值 信號之組態亦為可能的。 在一實例中,距離處理模組DS10經組態,使得距離指 示信號DI10之狀態係基於麥克風信號之功率梯度之間的類 似程度。距離處理模組DS10之此實施例可經組態以根據 140748.doc -22- 201013640 (A)麥克風信號之功率梯度之間的差異與一臨限值之間 的關係來產出距離指示信號DI1〇。一個此種關係可表達成 0 = jo, Hr li,否則 其中Θ表示距離指示信號DI10之當前狀態,\表示所感測 音訊信號S10之主要頻道(例如,對應於通常最直接地接收 來自所要源(諸如,使用者之話音)之聲音的麥克風的頻道) 參 的功率梯度之當前值,I表示所感測音訊信號S10之次要 頻道(例如,對應於比該主要頻道之麥克風較不直接地接 收來自所要源之聲音的麥克風的頻道)的功率梯度之當前 值,且Td表示一臨限值,該臨限值可為固定的或適應性的 (例如,基於該等麥克風信號中之一或多者的當前位準)。 在此特定實例中,距離指示信號DI10之狀態i指示遠場 源,且狀態〇指示近場源,但當然在需要時可使用相反實 施方案(亦即,使得狀態丨指示近場源且狀態〇指示遠場 ❹ 源)。 可希望實施距離處理模組DS〗0以將功率梯度之值計算 為相繼sfl框内所感測音訊信號sl〇之相應頻道的能量之間 的差異。在一個此種實例中’距離處理模組〇81〇經組態以 將功率梯度中之每一者的當前值計算為頻道之當前 訊框之值的平方的總和與頻道之先前訊框之值的平方的總 和之間的差異。在另一個此種實例中,距離處理模組DSl〇 經組瘧以將功率梯度\及1中之每一者的當前值計算為相 應頻道之當前訊框之值的量值的總和與頻道之先前訊框之 140748.doc -23- 201013640 值的量值的總和之間的差異β 另外或在替代例中,距離處理模組DS10可經組態,使 知距離指不仏號以10之狀態係基於在一頻率範圍内所感測 音訊信號S10之主要頻道之相位與次要頻道之相位之間的 相關程度。距離處理模組DS 1 0之此實施例可經組態以根據 (A)頻道之相位向量之間的相關性與(B) 一臨限值之間的關 係來產出距離指示信號DI1 〇。一個此種關係可表達成 ,,一 J0, corU>rc P = 否則 ’ 其中μ表示距離指示信號DI10之當前狀態,心表示所感測 音訊信號S10之主要頻道的當前相位向量,h表示所感測 音訊k就S10之次要頻道的當前相位向量,且表示一臨 限值,該臨限值可為固定或適應性的(例如,基於頻道中 之一或多者的當前位準)。可希望實施距離處理模組DS10 以計算相位向量,使得一相位向量之每一元素表示在相應 頻率下或在相應頻率副頻帶上相應頻道之當前相位角。在 此特定實例中,距離指示信號DI10之狀態i指示遠場源且 狀態0指示近場源,但當然在需要時可使用相反實施方 案。距離指示信被DI 10可應用作為雜訊減少級nr 1 〇之控 制信號’使得在距離指示信號DI10指示遠場源時,最大化 由雜訊減少級NR10執行之雜訊減少。 可希望組態距離處理模組D S 10,使得距離指示信號 DI10之狀態係基於下文所揭示之功率梯度及相位相關性準 140748.doc -24- 201013640 則兩者。在此種情況下,距離處理模組1)§1〇可經組態以將 距離指示信號DI10之狀態計算為0與4之當前值之組合(例 如,邏輯或或邏輯與)。或者,距離處理模組DSl〇可經組 態以根據此等準則(亦即,功率梯度類似性或相位相關性) 中之一者來計算距離指示信號〇110之狀態,使得相應臨限 之值係基於另一準則之當前值。 SSP濾波器SS10之替代實施例經組態以對所感測音訊信 號S10執行相位相關性遮罩操作以產出源信號S2〇及雜訊參 ❹ 考S30。SSP濾波器SS10之此實施例之一實例經組態以判 定在不同頻率下所感測音訊信號S10之不同頻道之間的相 關相位角。若多數頻率下之相位角大體上相等(例如,在 百分之五、十或二十内),則濾波器使彼等頻率通過作為 源信號S20且將其他頻率下之分量(亦即,具有其他相位角 之分量)分離至雜訊參考S30中。 加強器ΕΝ 10可經配置以接收來自時域緩衝器之雜訊參 考S30。另外或其他,加強器EN10可經配置以接收來自時 ❹ 域緩衝器之第一語音信號S40。在一實例中,每一時域緩 衝器具有十毫秒之長度(例如,在8 kHz之取樣速率下的八 十個樣本或在16 kHz之取樣速率下的160個樣本)。 加強器EN10經組態以對語音信號S40執行頻譜對比加強 操作以產出一經處理語音信號S50。可將頻譜對比界定為 信號頻譜中相鄰峰值與谷值之間的差異(例如,以分貝& 單位),且加強器EN10可經組態以藉由在語音信號S4〇之能 量譜或量譜中增加峰值與谷值之間的差異來產出經處理語 140748.doc •25· 201013640 曰L號S5G — 4音信號之頻譜峰值亦被稱作「共振峰 頻譜對比加強操作包括基於來自雜訊參考㈣之資訊來計 算複數個雜訊副頻帶功率估計;基於來自該語音信號之資 訊來產生-加強向量EV1G;及基於該複數個雜訊副頻帶 功率估計、來自語音信號_之資訊及來自加強向量EV10 之資訊來產出經處理語音信號85〇。 在一實例中,加強器EN1〇經組態以基於語音信號請來 產生-對比加強信號SC10(例如’根據本文所描述之技術 中之任-者)、計算雜訊參考咖之每一訊框之功率估計,⑩ 且藉由根據相應雜訊功率估計將語音信號s 3 〇與對比加強 USC10之相應訊框混合來產出經處理語音冑號㈣。舉 例而言’加強器則〇之此實施例可經組態以在相應雜訊功 率估計為高時相稱地更多使用對比加強信號SCH)之相應訊 框且在相應雜訊功率估計為低時相稱地更多使用語音信號 S40之相應訊框來產出經處理語音信號s5〇之訊框。加強器 EN10之此實施例可經組態以根據諸如 p)SS(n)之表達式來產出經處理語音信號s5〇之訊框❿ PSS(n) ’其中CES(n^ss(n)分別指示對比加強信號 及語音信號S40之相應訊框,且p指示一雜訊位準指示,該 雜訊位準指示具有基於相應雜訊功率估計的在零至一之範 圍中的值。 圖12展不頻譜對比加強器ENl〇之實施例eni的方塊 圖。加強器EN100經組態以產出一基於對比加強語音信號 scio之經處理語音信號S50。加強器ENl〇〇亦經組態以產 140748.doc •26- 201013640 出經處理語音信號S50,使得經處理語音信號S5〇之複數個 頻率副頻帶中之每一者係基於語音信號S4〇之一相應頻率 副頻帶。 加強器EN100包括:一加強向量產生器VG1〇〇,其經組 態以產生一基於語音信號S40之加強向量EV1〇 ; 一加強副 頻帶信號產生器EG100,其經組態以基於來自加強向量 EV10之資訊來產出一組加強副頻帶信號;及一加強副頻 帶功率估計產生器EP100,其經組態以產出一組加強副頻 參 帶功率估計,其各自基於來自該等加強副頻帶信號中之相 應者的資訊。加強器EN100亦包括:一副頻帶增益因數計 算器FC100,其經組態以計算複數個増益因數值,使得該 複數個增益因數值中之每一者係基於來自加強向量Evl〇 之一相應頻率副頻帶的資訊;一語音副頻帶信號產生器 SG100,其經組態以基於來自語音信號S4〇之資訊來產出 一組語音副頻帶信號;及一增益控制元件CE丨〇〇,其經組 ❹ 態以基於s亥等s吾音副頻帶信號及來自加強向量EV1 〇之資 訊(例如,該複數個增益因數值)來產出對比加強信號 SC10。 加強器EN100包括··一雜訊副頻帶信號產生器ng 1〇〇, 其經組態以基於來自雜訊參考S30之資訊來產出一組雜訊 副頻帶信號;及一雜訊副頻帶功率估計計算器Np 1 〇〇,其 經組態以產出一組雜訊副頻帶功率估計,其各自基於來自 該等雜訊副頻帶信號中之相應者的資訊。加強器EN1 〇〇亦 包括:一副頻帶混合因數計算器FC200,其經組態以基於 140748.doc •27· 201013640 自—相應雜訊副頻帶功率估計之資訊來計算該等副頻帶 之母者的展合因數;及一混合器χι〇〇,其經組態以基 ;次自/等'吧〇因數、語音信號S40及對比加強信號SC10 之資訊來產出經處理語音信號S50。 。明確地提到’在應用加強議⑽(及本文所揭示之加強 10的其他實施例中之任一者)過程中,可希望自已經 受回音消除操作(例如,如下文參考音訊預處理器AP20及 回音消除器EC10所描述)之麥克風信號獲得雜訊參考㈣。 對於語音信號S40為再生音訊信號之情況而言,此操作可 尤其合意。若聲回音保留於雜訊參考S30中(或可由下文所 揭不之加強器ENl〇之其他實施例使用的其他雜訊參考中 之任一者中)’則可在經處理語音信號㈣與副頻帶增益因 數計算路徑之間產生-正反饋迴路。舉例而言,此迴路可 具有經處理語音信號S50將一遠端揚聲器驅動得更大聲加 強器便將傾向於使增益因數增加得更多的效應。 ❿ 在一實例中’加強向量產生器VG1〇〇經組態以藉由使語 音信號S40之量譜或功率譜升高至河次幂,m大於一 如,在1.2至2.5之範圍中的值,諸如j 2、} 5、ι 7、t ^ 二)來產生加強向量EV1G。加強向量產生器VG⑽可經組 態以根據諸如之表達式來對對數㈣值執行此操 作,其中4表示以分貝為單位的語音信號S4〇之頻譜的值' 且h表示以分貝為單位的加強向量EVl〇之相應值。加強向 量產生器V G10 0亦可經組態以正規化功率升高操作之結果 及/或將加強器向量EV1〇作為功率升高操作之結果與^始 140748.doc •28· 201013640 量譜或功率譜之間的比率來產出。 在另f例中’加強向量產生器VG1GG經組態以藉由使 "。日L號S40之頻譜的二階導數平滑化來產生加強向量 10加強向量產生器VG丨〇〇之此實施例可經組態以根據 : 2(Xl) Xl-1+Xl+1-2Xi之表達式來將離散項中之二階導數 计算為一 1¾差刀,其中頻譜值X可為線性或對數的(例如, 以刀貝為單位)。二階差分D2(Xi)之值在頻譜峰值處小於零 且在頻譜谷值處大於零,且可希望組態加強向量產生器 G1 00以將該—階差分計算為此值之負數(或對經平滑二階 差刀求反)以獲得在頻譜峰值處大於零且在頻譜谷值處小 於零的結果。 •加強向里產生器VG100可經組態以藉由應用一平滑濾波 器(諸如,加權平均濾波器(例如,三角濾波器))來使頻譜 一階差分平滑化。平滑濾波器之長度可基於頻譜峰值之估 計頻寬。舉例而言,可希望平滑濾波器使具有小於所估計 春峰值頻寬之兩倍的週期的頻率衰減。典型平滑渡波器長度 包括二個、五個、七個、九個、十一個、十三個及十五個 分接頭。加強向量產生器VGl〇〇之此實施例可經組態以連 續地執行差分及平滑計算或作為一個操作來執行。圖13展 示語音信號S40之訊框的量譜之實例,且圖M展示計算為 由十五分接頭三角濾波器平滑之二階頻譜差分的加強向量 EV10之一相應訊框的實例。 在類似實例中’加強向量產生器VG100經組態以藉由用 高斯差(DoG)濾波器來卷積語音信號S40之頻譜來產生加強 140748.doc •29- 201013640 向量EV10,該高斯差濾波器可根據諸如下式之表達 χχ-μ σιν^Τχρ(ν )-- :exp(. 2σ\ 其中σ4σ2表示各別高斯分布之標準差,且μ表示頻譜平 均數。亦可使用具有與DoG濾波器類似之形狀的另一^波 器(諸如,「墨西哥帽狀」小波濾波器)。在另一實例中:加 強向量產生器VG100經組態以將加強向量Ενι〇作為以分貝 為單位的語音信號S40之平滑頻譜之指數的二階差分來產 出。 在另一實例中,加強向量產生器¥(}1〇〇經組態以藉由計 算語音信號S40之平滑頻譜之比率來產生加強向量EVi〇。 加強向量產生态VG100之此實施例可經組態以藉由使語音 信號S40之頻譜平滑化來計算一第一平滑信號,藉由使該 第一平滑信號平滑化來計算一第二平滑信號,且將加強向 量EV1 〇計算為該第一平滑信號與該第二平滑信號之間的 比率。圖15至圖18分別展示語音信號S40之量譜、該量譜® 之平滑型式、該量譜之雙平滑型式及該平滑譜與該雙平滑 譜之比率的實例。 圖19A展示加強向量產生器vg 1〇〇之實施例VG110的方 塊圖,實施例VG110包括一第一頻譜平滑器SM1 〇、一第二 頻譜平滑器SM20及一比率計算器RC丨〇。頻譜平滑器SM1 0 經组態以使語音信號S40之頻譜平滑化以產出一第一平滑 k號MS10。頻譜平滑器smio可實施為一平滑濾波器’諸 140748.doc -30· 201013640 如加權平均濾波器(例如,三角濾波器)。平滑濾波器之長 度可基於頻譜峰值之估計頻寬。舉例而言,可希望平滑濾 波器使具有小於所估計峰值頻寬之兩倍的週期的頻率衰 減。典型平滑濾、波器長度包括三個、五個、七個、九個、 十一個、十三個及十五個分接頭。 頻譜平滑器SM20經組態以使第_平滑信號Msi〇平滑化 以產出—第二平滑信號MS2〇。頻譜平滑器助〇通常經組 態、以執行與頻譜平滑器SM1〇相同之平滑操作。然而,亦 9 可能實施頻譜平滑器SM1_M2〇以執行不同平滑操作(例 如,使用不同濾、波器形狀及/或長度)。頻譜平滑器说10及 SM20可實施為不同結構(例如,不同電路或軟體模组)或在 不同時間時實施為相同結構(例如,經組態以隨時間過去 而執行一序列不同任務的計算電路或處理器)。比率計算 器Rdo經組態以計算信號河81〇與以82〇之間的比率(亦 即,信號MS10與MS20之相應值之間的一連串比率)以產出 ❷加強向#謂〇之-例子膽卜在—實例中,比率計算器 RC10經組態以將每一比率值計算為兩個對數值之差。 圖20展示藉由頻譜平滑器8河1〇之十五分接頭三角濾波 器實施例自圖13之量譜產出的平滑信號MSl〇之實例:圖 21展示藉由頻譜平滑器SM2〇之十五分接頭三角濾波器實 施例自圖20之平滑信號Msl〇產出的平滑信號ms2〇之實 例,且圖22展示為圖20之平滑信號MSl〇與圖幻之平滑信 號MS20之比率的加強向量之訊框的實例。 如上文所描述,加強向量產生器¥〇1〇〇可經組態以將語 140748.doc 201013640 音信號S40作為頻譜信號來處理(亦即,在頻域中對於 語音彳s號S40之頻域例子以其他方式為不可用的裝置α1〇〇 實施例而言,加強向量產生器VG100之此實施例可包括變 換模組TR10之一例子,其經配置以對語音信號S4〇之時域 例子執行變換操作(例如,FFT)。在此種情況下,加強副 頻帶信號產生器EG100可經組態以在頻域中處理加強向量 EV10,或加強向量產生器VG1〇〇亦可包括逆變換模組 TR20之一例子,其經配置以對加強向量丨〇執行逆變換 操作(例如,逆FFT)。 可使用線性預測分析來計算一全極點濾波器之參數,該 王極點濾波器在語音信號之訊框期間模擬揚聲器之聲道的 八振加強向量產生器VG100之另一實例經組態以基於語 音信號S40之線性預測分析之結果來產生加強向量Ενΐ()。 加強向量產生器VG 100之此實施例可經組態以基於相應全 極點濾波器之極點(例如,自語音信號S4〇之每一有聲訊框 的組線性預測編碼(LPC)係數(諸如,濾波器係數或反射 係數)判定)來追蹤該訊框之一或多個(例如,兩個、三個、 四個或五個)共振峰。加強向量產生器VGi〇〇之此實施例可 匕組態以藉由在該等共振峰之中心、頻率下將帶通渡波器應 用於語音信號S4G或藉由以其他方式提昇語音信號S4〇之含 有該等共振♦之中心頻率的副頻帶(例如,如使用本文所 論述之均—或非均—副頻帶劃分方案來界定的)來產出加 強向量EVl〇。 加強向量產生器VG100亦可經實施以包括—預加強處理 140748.doc 201013640 模組PMl0,預加強處理模組PM10經組態以在如上文所描 述之加強向量產生操作上游對語音信號S4〇執行一或多個 預處理操作。圖19B展示加強向量產生器VG110之此實施 例VG120的方塊圖。在一實例中,預加強處理模組卩^⑺經 組態以對語音信號S40執行動態範圍控制操作(例如,壓縮 及/或擴展)。動態範圍壓縮操作(亦被稱作「軟限制」操 作)根據大於一之輸入輸出比率來將超過一臨限值之輸入 位準映射至超過該臨限值一較小量的輸出值。圖23A之點 攀畫1線展示用於固定輸入輸出比率的此轉移函數之實例,且 圖23 A中之實線展示用於隨輸入位準而增加之輸入輸出比 率的此轉移函數之實例。圖233展示根據圖23A之實線之 動態範圍壓縮操作對三角波形的應用,其中點線指示輸入 波开> 且實線指示經壓縮波形。 圖24A展不一動態範圍壓縮操作之轉移函數的實例,該 動態範圍壓縮操作根據在低頻率下小於一且隨輸入位準而 ❹增加之輸人輸出比率來將低於該臨限值之輸人位準映射至 較高輸出位準。圖24B展示此操作對三角波形之應用其 中點線指示輸入波形且實線指示經壓縮波形。 如圖及圖24B之實财所*,預力口強處理模組ρΜι〇 可經組態以在時域中對語音信號S4〇執行動態範圍控制操 作(例如,在抓操作上游)。或者,預加強處理模組PM10 可經组態以對語音信號S40之頻譜(亦即,在頻域中)執行 動態範圍控制操作。 另外或其他,預加強處理模組Pmiq可經組態以在加強 140748.doc •33· 201013640 向量產生操作上游對語音信號S40執行適應性等化操作。 在此種清況下,預加強處理模組PM10經組態以將雜訊參 考S30之頻譜添加至語音信號s4〇之頻譜。圖25展示此操作 之實例’丨中實線指示在等化之前的語音信號S40之-訊 框的頻谱,點線指示雜訊參考S30之一相應訊框的頻譜, 且虛線指示在等化之後的語音信號S40之頻譜。在此實例 中二可看到在等化之前,語音信號S4〇之高頻分量被雜訊 =蓋且等化操作適應性地提昇此等分量’其可預期增加 可懂度。預加強處理模組PM1〇可經組態以在全fft解析度 下或如本文所描述對語音信號S4〇之一組頻率副頻帶中之 每一者執行此適應性等化操作。 月確地提到,裝置A11〇可不必要對源信號s2〇執行適應 性等化操作,因為SSP濾波器ssl〇已操作以將雜訊與語音 信號分離。然而,用於在源信號S2〇與雜訊參考s3〇之間的 分離為不充分(例如’如下文參考分離評估器咖崎論述) 的訊框之此裝置中,此操作可變成有用的。 如圖25之實例所示,語音信號傾向於具有向下之頻譜傾 斜,信號功率在較高頻率處下降。因為雜訊參考S3〇之頻 譜傾向於比語音信號S40之頻譜平坦,所以一適應性等化 操作傾向於減少此向下頻譜傾斜。 預加重可由預加強處理模組PMl〇對語音信號S4〇執行以 獲得傾斜減少信號的傾斜減少預處理操作之另一實例。在 一典型實施例中’預加強處理模組PM職組態以藉由應 用形式Uaz·1之-階高通濾波器來對語音信號s4〇執行預: 140748.doc -34- 201013640 重操作,在該形式之濾波器中,α具有自0.9至1.0之範圍的 值。此濾、波器通常經組態以將高頻率分量提昇每八音度約 六dB °傾斜減少操作亦可減少頻譜峰值之量值之間的差 異。舉例而言,此操作可藉由相對於較低頻率第一共振峰 之振幅來增加較高頻率第二及第三共振峰之振幅來等化語 音信號。傾斜減少操作之另一實例將一增益因數應用於語 音#號S40之頻譜,其中該增益因數之值隨著頻率增加且 不取決於雜訊參考S3 0。 可希望實施裝置A120,使得加強器EN 10a包括加強向量 產生器VG100之一實施例vg 100a,實施例VG 100a經配置 以基於來自語音信號S4〇之資訊來產生一第一加強向量 EVlOa ’且加強器ENlOb包括加強向量產生器VG100之一 實施例VGlOOb,實施例VGi〇0b經配置以基於來自源信號 S20之資訊來產生一第二加強向量vGi〇b。在此種情況 下’產生器VGlOOa可經組態以執行與產生器VGlOOb不同 之加強向量產生操作。在一實例中,產生器Vgi〇〇a經組 態以藉由自一組線性預測係數追縱語音信號S4〇之一或多 個共振峰來產生加強向量VGlOa,且產生器VGlOOb經組態 以藉由計算源信號S20之平滑頻譜的比率來產生加強向量 VGlOb。 雜訊副頻帶信號產生器NG100、語音副頻帶信號產生器 SG100及加強副頻帶信號產生器egi〇〇中之任一者或所有 可實施為圖26A所示之副頻帶信號產生器SG200的各別例 子。副頻帶信號產生器SG200經組態以基於來自信號a(亦 140748.doc •35· 201013640 即,雜訊參考S30、語音信號S4〇或在適當時加強向量 EV10)之資訊來產出一組q個副頻帶信號8(丨),其中且 q為®彳頻帶之所要數目(例如,四個、七個、八個、十二 個、十六個、二十四個)。在此種情況下,副頻帶信號產 生器SG200包括一副頻帶濾波器陣列S(}1 〇,副頻帶濾波器 陣列SG10經組態以藉由相對於信號a之其他副頻帶將一不 同增益應用於信號A之相應副頻帶(亦即,藉由提昇通頻帶 及/或使阻頻帶衰減)來產出副頻帶信號8(1)至8((1)中之每— 者0 副頻帶濾波器陣列SG10可經實施以包括經組態以並列 地產出不同副頻帶信號的兩個或兩個以上分量濾波器。圖 28展示副頻帶濾波器陣列SG1〇之此實施例S(J12的方塊 圖,實施例SG12包括並列地配置以執行信號A之副頻帶分 解的q個帶通濾波器Fl0-1至F10_q的陣列。濾波器^1〇-1至 F10-q中之每一者經組態以對信號八進行濾波以產出^個副 頻帶信號S(l)至S(q)中之相應者。 渡波器F10-1至Fl〇-q中之每一者可經實施以具有一有限 脈衝響應(FIR)或一無限脈衝響應(IIR)。在—實例中,副 頻帶遽波器陣列S G12實施為一小波或多相分析渡波器組。 在另一實例中,濾波器F10-1至Fl〇_q中之一或多者(可能所 有)中之每一者實施為二階IIR區段或「雙二階」遽波器。 雙二階濾波器之轉移函數可表達成 140748.doc -36· (1) 201013640 可希望使用轉置直接形式II來實施每一雙二階濾波器,尤 其對於加強器EN10之浮點實施例而言。圖29A說明攄波器 F10-1至Fl〇-q中之一者的通用IIR濾波器實施例之轉置直接 形式II ’且圖29B說明濾波器F10-1至Fl〇-q中之一者的雙二 階實施例的轉置直接形式II結構。圖30展示濾波器?1〇1至 F1 〇-4中之一者的雙二階實施例之一實例的量值及相位響 應曲線圖。 可希望濾波器F1 0-1至F10-q執行信號a之非均一副頻帶 ❹ 分解(例如,使得濾波器通頻帶中之兩者或兩者以上具有 不同寬度)而非均一副頻帶分解(例如,使得濾波器通頻帶 具有相等寬度)。如上文所提到,非均一副頻帶劃分方案 之實例包括先驗方案(諸如,基於巴克標度之方案)或對數 方案(諸如,基於梅爾標度之方案)。一個此種劃分方案由 圖27中之點說明,該等點對應於頻率2〇 3⑼Hz、
Hz、1〇80 Hz、172〇 Hz、27〇〇 Hz、44〇〇 出及?·出且 0 扣不寬度隨著頻率增加的一組七個巴克標度副頻帶之邊 緣。此副頻帶配置可用於寬頻帶語音處理系統(例如,具 有16 kHz之取樣速率的器件)中。在此劃分方案之其他實 例中,省略最低副頻帶以獲得六副頻帶方案,及/或將最 高副頻帶之上限自7700 Hz增加至8〇〇〇 Hz。 在乍頻▼语音處理系統(例如,具有8 kHz之取樣速率的 器件)中,可希望使用較少副頻帶之配置。此副頻帶劃分 方案之一實例為四頻帶準巴克方案3〇〇_51〇 Hz、51〇 92〇 Hz、92(M480 HZ& ^80-4000 Ηζβ使用寬之高頻率頻帶 140748.doc *37- 201013640 U〗如如在此實例中)可為所要的,此係由於低副頻帶能 量估计及/或為了處理用雙二階濾波器模擬最高副頻帶過 程中的困難。 渡波器FUM至F10_q中之每一者經組態以在相應副頻帶 上提供增益提昇(亦,信E量值之增加)及/或在其他副頻 帶上提供衰減(亦即,信號量值之減少)。該等濾波器中之 每一者可經組態以將其各別通頻帶提昇了約相同量(例 如,提昇了三dB,或提昇了六犯)。或者,該等遽波器中 之每一者可經組態以使其各別阻頻帶衰減了約相同量(例 如’衰減了三dB,或衰減了六dB)。圖31展示可用於實施 一組滤波器FUM至隱代—連争七個雙二階濾、波器的量 值及相位響應,其中q等於七。在此實例中,每一濾波器 經組態以將其各別副頻帶提昇了約相同量。可希望組態濾 波器F1 0-1至F1 〇-q,使得每一濾波器具有相同峰值響應, 且該等濾波器之頻寬隨著頻率增加。 或者,可希望組態濾波器1?〗0_1至1?1〇_(1中之一或多者以 提供比該等濾波器中之另一者多的提昇(或衰減舉例而 言,可希望在雜訊副頻帶信號產生器NG1〇〇、語音副頻帶 L號產生器SG100及加強副頻帶信號產生器EG1〇〇中之一 者中組態一副頻帶濾波器陣列SG1〇之濾波器F1〇1至Fi〇_q 中的每一者以將相同增益提昇提供給其各別副頻帶(或將 相同衰減提供給其他副頻帶),且在雜訊副頻帶信號產生 态NG100、語音副頻帶信號產生器8(}1〇〇及加強副頻帶信 號產生器EG100中之另一者中組態一副頻帶濾波器陣列 140748.doc •38. 201013640 SG10之濾波器卩1〇-1至1?10_(1中的至少—些以根據(例如)所 要心理聲學加權函數來提供彼此不同之増益提昇(或衰 減)。 圖28展示慮波器F1(M至F10_q並列地產出副頻帶信號 S(l)至S(q)的配置。一般熟習此項技術者將理解,此等濾 波器中之一或多者中的每一者亦可經實施以連續地產出副 頻帶信號中之兩者或兩者以上。舉例而言,副頻帶濾波器 陣列SG10可經實施以包括一濾波器結構(例如,雙二階濾 ^ 波器)’該濾波器結構在一時間時用第一組濾波器係數值 來組態以對信號A進行濾波從而產出副頻帶信號s(1)iS(q) 中之一者,且在一隨後時間時用第二組濾波器係數值來組 態以對信號A進行濾波從而產出副頻帶信號^。至“幻中之 不同者。在此種情況下,可使用少於q個帶通濾波器來實 施副頻帶濾波器陣列SG10。舉例而言,可能用單一渡波器 結構來實施副頻帶濾波器陣列SG10,該單一濾波器結構以 φ 使得根據q組遽波器係數值中之各別者來產出q個副頻帶信 號S(l)至S(q)中之每一者的方式來連續地重新組態。 另外或其他,雜訊副頻帶信號產生器NG100、語音副頻 帶信號產生器SG1 00及加強副頻帶信號產生器EG100中之 任一者或所有可實施為圖26B所示之副頻帶信號產生器 SG300的例子。副頻帶信號產生器SG3〇〇經組態以基於來 自信號A(亦即,雜訊參考S30、語音信號S40或適當時加強 向量EV10)之資訊來產出一組q個副頻帶信號s(i),其中 12分且q為副頻帶之所要數目。副頻帶信號產生器SG300 140748.doc -39· 201013640 包括一變換模組SG2〇,變換模組SG2〇經組態以對信號A執 订變換操作以產出一經變換信號τ。變換模組8<32〇可經組 態以對信號A執行一頻域變換操作(例如’經由快速傅立葉 變換或FFT)以產出一頻域變換信號。變換模組SG2〇之其 他實施例可經組態以對信號A執行不同變換操作(諸如,小 波變換操作或離散餘弦變換(DCT)操作)。可根據所要均— 解析度來執行變換操作(例如,32點、64點、128點、 點或512點FFT操作)。 副頻帶信號產生器SG300亦包括一頻格化模組SG3〇,頻 格化模組SG30經組態以藉由根據所要副頻帶劃分方案將經 變換信號T劃分成一組q個頻格來將該組副頻帶信號產 出為該組頻格。頻格化模組SG3〇可經組態以應用均一副頻 帶劃分方案。在均一副頻帶劃分方案中,每一頻格具有大 體上相同之寬度(例如,約百分之十内)。或者,可希望頻 格化模組SG30應用為非均一之副頻帶劃分方案,因為心理 聲學研究已表明人類聽力在頻域中對非均一解析度起作 用。非均一副頻帶劃分方案之實例包括先驗方案(諸如, 基於巴克標度之方案)或對數方案(諸如,基於梅爾標度之 方案)。圖27中之該點列指示一組七個巴克標度副頻帶之 邊緣’該等邊緣對應於頻率2〇 Hz、300 Hz、630 Hz、 1080 Hz、1720 Hz、2700 Hz、4400 Hz 及 7700 Hz。此副頻 帶配置可用於具有16 kHz之取樣速率的寬頻帶語音處理系 統中。在此劃分方案之其他實例中,省略較低副頻帶以獲 得六副頻帶配置’及/或將高頻率限制自77〇〇 Hz增加至 140748.doc -40- 201013640 綱0 Hz。頻格化模組SG3〇通常經實施以將經變換信號τ劃 刀成、且非重叠頻格’但亦可實施頻格化模組SG30使得該 等頻格中《4多者(可能所有)重疊至少一鄰近頻格。 ^上文對副頻帶信號產生器SG200及SG300的論述假定信 f產生器將信號A作為時域信號來接收。或者,雜訊副頻 號產生器]sjg 1 〇〇、語+副頻帶信號產生器SG1 〇〇及加 強田J頻帶u產生器EG100中之任一者或所有可實施為圖 C所示之w彳頻帶抬號產生器SG400的例子。副頻帶信號 產生器SG400經組態以將信號a(亦即,雜訊參考、語 音信號S40或加強向量Ενι〇)作&變換域信號來接收且基於 來自信號A之資訊產出一組q個副頻帶信號s(i)。舉例而 曰,剎頻帶信號產生器SG4〇〇可經組態以將信號A作為頻 域信號或作為小波變換、DCT或其他變換域中之信號來接 收。在此實例中,副頻帶信號產生器SG4〇〇實施為如上文 所描述之頻格化模組SG30之一例子。 φ 雜訊副頻帶功率估計計算器NP100及加強副頻帶功率估 计计算器EP 1〇〇中之任一者或兩者可實施為圖26D所示之 副頻帶功率估計計算器EC110的例子。副頻帶功率估計計 算器EC110包括一求和器EC10,求和器Ecl〇經組態以接收 該組副頻帶信號S(i)且產出一組相應q個副頻帶功率估計 Ε(ι) ’其中《。求和器EC10通常經組態以計算信號 Α(亦即,雜訊參考S30或適當時加強向量evio)之連續樣本 之每一區塊(亦被稱作「訊框」)的—組q個副頻帶功率估 计。典型訊框長度之範圍為約五毫秒或十毫秒至約四十毫 140748.doc 201013640 私或五十毫秒,且訊框可為重疊或非重疊的。由一操作處 理之戒框亦可為由不同操作處理之較大訊框的區段(亦 即’「子訊框」)。在一特定實例中,將信號Α劃分成10毫 移非重疊讯框之序列,且求和器EC1〇經組態以計算信號a 之每一訊框的一組q個副頻帶功率估計。 在一實例中,求和器EC10經組態以將該等副頻帶功率 估计Ε(ι)中之每_者計算為副頻帶信號之相應者的值之 平方的總和。求和器Ec i 〇之此實施例可經組態以根據諸如 下式之表達式來計算信號A之每一訊框的一組q個副頻帶功 0 率估計: E(l,k) = ^ekS(i,j)2, l<i<q, (2) 其中五(/,A〇表示副頻帶Z及訊框1之副頻帶功率估計,且 NQ)表示第Η固副頻帶信號之第7•個樣本。 在另貫例中,求和器EC 10經組態以將該等副頻帶功 十E(i)中之母一者計算為副頻帶信號s(〇之相應者的值 之量值的總和。求和器EC1〇之此實施例可經組態以根據諸❹ 弋之表達式來计算彳έ號A之每一訊框的一組q個副頻帶 功率估計: E(U) = 2M|S(i,j)|,lsigq。 ⑺ 可希望實施求和器EC1〇以藉由信號A之相應總和來正規 化每-副頻帶總和。在一個此種實例中,求和器Η。。經組 &以將該等副頻帶功率估計E⑴中之每一者計算為被信號 140748.doc -42· 201013640 A之值的平方之總和除的副頻帶信號s(i)中之相應者的值 之平方的總和。求和器EC 10之此實施例可經組態以根據諸 如下式之表達式來計算信號A之每一訊框的一組q個副頻帶 功率估計: E(i,k) =
IjekA(j)2 l<i<q > (4a) 其中3(/)表示信號A之第個樣本。在另一個此種實例中, • 求和器E C1 〇經組態以將每一副頻帶功率估計計算為被信號 A之值之量值的總和除的副頻帶信號$(丨)之相應者之值的 量值的總和。求和器EC1〇之此實施例可經組態以根據諸如 下式之表達式來計算音訊信號之每一訊框的一組q個副頻 帶功率估計: E(i,k) =
Ij6lc|s(ij)|ΣΜΝ)|, (4b) e 或者,對於該組副頻帶信號s⑴係由頻格化模組SG30之一 實施例產出的情況而言,可希望求和器ecig藉由副頻帶信 號S (i)之相應者中的總樣本數目來正規化每一副頻帶總 和對於使用除法運算來正規化每一副頻帶總和(例如, 如上文之表達式(4a)及(4b))之情況而言,可希望將小之非 、(j如正的)值ζ添加至分母以避免被零除之可能性。對 於所有副頻帶而言,值ζ可為相同的,或可針對該等副頻 帶中之兩者或兩者以上(可能所有)中之每一者使用不同Μ 值(例如1於達成調諸及,或加權目的ζ之值(或多個值) 140748.doc •43· 201013640 過去而加以調適(例如,自一個 可為固定的或可隨著時間 訊框至下一個訊插)。 5 "希望實施求和器EC1Q以藉由刪減信號A之相應 和來正規化每-副頻帶總和。在-個此種實例中,求和 器ECU)經組態以將該等副頻帶功率估計e⑴中之每一者計 算為M頻帶信號S(1)之相應者之值的平方的總和與信號A 之值之平方的總和之間的差異。求和器襲之此實施例可 -組態以根據諸如下式之表達式來計算信號a之每一訊框 的一組q個副頻帶功率估計: (讥 UUq。 (5a) 在另個此種實例中,求和器EC 1 〇經組態以將該等副頻帶 功率估計E(i)中之每一者計算為副頻帶信號8(丨)之相應者之 值的量值的總和與信號A之值之量值的總和之間的差異。 求和器EC10之此實施例可經組態以根據諸如下式之表達式 來計算信號A之每一訊框的一組q個副頻帶功率估計: = lsUq。 (5b) 舉例而言,可希望將雜訊副頻帶信號產生器NG100實施為 副頻帶濾波器陣列SG10之提昇實施例及將雜訊副頻帶功率 估計計算器NP100實施為求和器EC 10的經組態以根據表達 式(5b)來計算一組q個副頻帶功率估計的一實施例。另外或 其他,可希望將加強副頻帶信號產生器EG 100實施為副頻 140748.doc -44- 201013640 帶濾波器陣列SG10之提昇實施例及將加強副頻帶功率估計 。十算器EP1 00實施為求和器ec 1 〇的經組態以根據表達式 (5b)來計算一組q個副頻帶功率估計的一實施例。 雜訊副頻帶功率估計計算器Νρι〇〇及加強副頻帶功率估 汁汁算器EP100中之任一者或兩者可經組態以對副頻帶功 率估计執行時間平滑操作。舉例而言,雜訊副頻帶功率估 计計算器NP100及加強副、頻帶功率估計計算器eP1〇〇中之 任一者或兩者可實施為圖26E所示之副頻帶功率估計計算 器EC 120的例子。副頻帶功率估計計算器Ecl2〇包括一平 滑器EC20,平滑器EC2〇經組態以隨著時間過去使由求和 器EC10計算之總和平滑化以產出副頻帶功率估計E(i)。平 滑器EC20可經組態以將副頻帶功率估計E(i)計算為總和之 移動平均值。平滑器EC2〇之此實施例可經組態以根據諸如 以下各式中之一者的線性平滑表達式來計算信號A之每一 afl框的一組q個副頻帶功率估計ε(ι): E(i, k) <- aE(i, k -1) + (1 _ a)E(is k)? ⑹ E(i,k) ^ 〇E(i,k-1) + (i _ a)|E(isk)|s (7) E(i,k) <- aE(i,k-1) + (1 _ (8) ,其中平滑因數a為在零(不平滑)至一(最大平滑,不 更新)之範圍中的值(例如,〇 3、〇 5、〇 7、〇 9、〇 99或 0.999)。可希望平滑器EC20針對所有q個副頻帶使用平滑 因數a之相同值。或者,可希望平滑器EC2〇針對q個副頻帶 140748.doc -45- 201013640 令之兩者或兩者以上(可能所有)中之每—者使用平滑因數 :之不同值。平滑因數α之值(或多個值)可為固定的或可隨 著時間過去而加以調適(例如,自一個訊框至下一個訊 框)。 副頻帶功率估計計算㈣12G之—特定實例經組態以根 據上述表達式(3)來計算q個副頻帶總和且根據上述表達式 (7)來計算q個相應副頻帶功率估計。副頻帶功率估計計算 器EC12〇之另一特定實例經組態以根據上述表達式(5b)來 計算q個副頻帶總和且根據上述表達式⑺來計算^個相應副 頻帶功率估8十。然而,請注意,藉此個別明確地揭示表達 式(2)至(5b)中之一者與表達式(6)至(8)中之一者的所有十 個了能組〇。平滑器EC20之替代實施例可經組態以對由 求和器EC 10計算之總和執行非線性平滑操作。 明確地提到,上文所論述之副頻帶功率估計計算器 EC110之實施例可經配置以將該組副頻帶信號s(〇作為時 域信號或作為變換域中之信號(例如,作為頻域信號)來接 收。 增益控制元件CE100經組態以將複數個副頻帶增益因數 中之每一者應用於語音信號S40之相應副頻帶以產出對比 加強語音信號SC 10。可實施加強器EN10,使得增益控制 元件CE100經配置以將加強副頻帶功率估計作為該複數個 增益因數來接收。或者,增益控制元件CE100可經組態以 自副頻帶增益因數計算器FC100(例如,如圖12所示)接枚 該複數個增益因數。 140748.doc -46 - 201013640 副頻帶增益因數計算器Fc副經組態以基於來自相應加 強田1J頻帶功率估計之資訊來針對q個副頻帶中之每-者計 算、’日现因數Μ1)中之相應者,其中。計算器 FC100可經組態以藉由將上限仙及/或下限應用於相應 力°強副頻帶功率估計E⑴來計算㈣帶增益因數中之一或 (0月b所有)中之母一者(例如,根據諸如g(丨)=瓜叫认五⑼ 及/或G(〇 = min(i/I,印))之表達式)。另外或其他,計算器 FC100可經組態以藉由正規化相應加強副頻帶功率估計來 計算該等副頻帶增益因數中之—或多者(可能所有)中之每 者舉例而舌,計算器FC100之此實施例可經組態以根 據諸如下式之表達式來計算每一副頻帶增益因數〇(丨): maxi^E(i) 另外或其他,計算器FC100可經組態以對每一副頻帶增益 因數執行時間平滑操作。 參 可希望組態加強器EN10以補償可由副頻帶之重疊引起 的過度提昇。舉例而言,增益因數計算器FC1〇〇可經組態 以減少中間頻率增益因數(例如,包括頻率fs/4之副頻帶, 其中fs表示語音信號S40之取樣頻率)中之一或多者的值。 增益因數什异器FC 100之此實施例可經組態以藉由將增益 因數之當前值乘以具有小於一之值的標度因數來執行該減 少。增益因數計算器FC100之此實施例可經組態以針對待 按比例減小之每一增益因數使用相同標度因數,或替代 140748.doc -47- 201013640 地,針對待按比例減小之每一增益因數使用不同標度因數 (例如基於相應副頻帶與一或多個相鄰副頻帶的重疊程 度)。 ^ 另2或其他,可希望組態加強器EN10以增加對高頻率 田1J頻▼中之-或多者的提昇程度。舉例而言,可希望組態 增益因數計算㈣⑽以確保語音信號州之―或多個高頻' 率田J頻帶(例如,最高副頻帶)之放大不低於—中間頻率副 頻帶(例如,包括頻率fs/4之副頻帶,其中fs表示語音信號 S40之取樣頻率)之放大。增益因數計算器fc⑽可經組態 以藉由將—中間頻率副頻帶之增益因數的當前值乘以大$ -之標度因數來計算一高頻率副頻帶之增益因數的當前 值。在另一實例中,增益因數計算器Fci〇〇經組態以將一 高頻率副頻帶之增益因數的當前值計算為以下各者中之最 大者:(A)根據本文所揭示之技術中之任一者基於彼副頻 帶之雜訊功率估計計算的當前增益因數值及藉由將一 中間頻率副頻帶之增益因數的當前值乘以大於一之標度因 數而獲得的值。另外或其他,增益因數計算器fci〇〇可經 組態以使用上界UB之較高值來計算一或多個高頻率副頻 帶之增益因數。 增益控制元件C E10 0經組態以將增益因數中之每一者應 用於語音信號S40之相應副頻帶(例如,將增益因數作為= 益因數向量來應用於語音信號,以產出對比加強語音; 號謂。增益控制元件CE1〇〇可經組態以(例如)藉由將語 音信號S40之訊框的頻域副頻帶中之备―土奋 w有乘以相應增益 140748.doc -48- 201013640 因數G(i)來產出對比加強語音信號scl〇之頻域型式。增益 控制7G件CE100之其他實例經組態以使用重疊相加或重疊 儲存方法來將增益因數應用於語音信號S4〇之相應副頻帶 (例如,藉由將增益因數應用於一合成濾波器組之各別濾 波器)。 增益控制元件CE100可經組態以產出對比加強語音信號 scio之時域型式。舉例而言,增益控制元件cei〇〇可包括 副頻帶增益控制元件G20_l至G20-q(例如,乘法器或放大 罾 11 )之陣列,其中副頻帶增益控制元件中之每一者經配置 以將增益因數G(1)至G(q)中之各別者應用於副頻帶信號 s(l)至s(q)中之各別者。 副頻帶混合因數計算器FC2〇〇經組態以基於來自相應雜 Λ副頻帶功率估計之資訊而針對q個副頻帶中之每一者計 算一組混合因數M⑴中之相應者,其中圖”八展示 混口因數s十算器FC200之實施例FC25〇的方塊圖,實施例 ⑩FC25G經組態以將每-混合因數M⑴計算為對相應副頻帶 之雜訊位準η的指示。混合因數計算器⑽%包括—雜訊位 準^不5十算器NL10,雜訊位準指示計算器NL10經組態以 基於該組相應雜訊副頻帶功率估計來計算語音信號之每一 几忙k的&雜訊位準指示咕,,使得每—雜訊位準指示 才曰丁雜訊參考S30之相應副頻帶中的相關雜訊位準。雜訊 2準指不計算器NL1〇可經組態以計算雜訊位準指示中之 每者使之具有在某範圍(諸如,零至一)内之值。舉例而 言’雜訊位準指示計算器Nu〇可經組態以根據諸如下式 140748.doc 49· 201013640 之表達式來計算一組q個雜訊位準指示中之每一者: η(ί5 k) = max(min(EN (i, k), , η眶(9Α) 其中五〆ί, Α:)表示副頻帶/及訊框的由雜訊副頻帶功率估計 計算器NP100(亦即,基於雜訊參考S30)產出之副頻帶功率 估計;表示副頻帶ζ·及訊框灸的雜訊位準指示;且〜〇 及7 max 分別表示之最小值及最大值。 雜訊位準指示計算器NL10之此實施例可經組態以針對 所有q個副頻帶使用相同之值及%〇值,或替代地,可麵 經組態以針對副頻帶使用彼此不同之值及/或%n值。 此等界限中之每一者的值可為固定的。或者,可根據(例 如)加強器EN10之所要邊限及/或經處理語音信號S5〇之當 前音量(例如,如下文參考音訊輸出級〇1〇描述的音量控制 信號VS10之當前值)來調適此等界限中之任一者或兩者的 值。另外或其他,此等界限中之任一者或兩者的值可基於 來自語音信號S40之資訊(諸如’語音信號S4〇之當前位參 準)在另實例中,雜訊位準指示計算器NL 1 0可經組態 以根據諸如下式之表達式藉由正規化副頻帶功率估計來計 算一組q個雜訊位準指示中之每一者: η(ί,k) =- maWEN(x,k)) ° (9B) 此合因數计算器FC200亦可經組態以對混合因數M⑴中 之一或多者(可能所有)中之每—者執行平滑操作。
圖33B 140748.doc -50. 201013640 展示混合因數計算器FC250之此實施例fc26〇的方塊圖, 實施例FC260包括經組態以對由雜訊位準指示計#器犯〇 產出之q個雜訊位準指示中之—或多者(可能所有)中之每一 者執行時时滑操作时滑iiGC2G。在—實射,平與 ㈣㈣態以根據諸如下式之表達式來對q個雜訊位: 日示中之母一者執行線性平滑操作: (1〇) :中β為平滑因數。在此實例中,平滑因數#有在零(不 平滑)至-(最大平滑,不更新)之範圍中的值(例如,〇3、 0 5、0 7、0 9、0.99或 0.999)。 可希望平滑器GC20取決於混合因數之當前值與先前值 :間的關係來在平滑因數β之兩個或兩個以上之值中選擇 。舉例而t,可希望平滑器GC2〇藉由在雜訊之程度 二時允許混合因數值更快地改變及/或藉由在雜訊之程 少時抑制混合因數值之快速改變來執行微分時間平滑 、作。此組態可有助於抵制高聲雜訊甚至在 7續遮罩所要聲音的心理聲學時間遮罩效應。因此,可 因L’較之在雜訊位準指示之#前值大於w值時的平滑 :β之值,平滑因糾之值在雜訊位準指示之當前值小於 以時較大。在—個此種實例中,平滑經組態 =根據諸如下式之表達式來對q個雜訊位準指示中之每一 者執行線性平滑操作: 140748.doc -51 - 201013640 M(i,k) — k — 〇 + (1 ~1)如,k),r|(i,k) > η(ί,k -1) lPdeJl(i,k-l) + (lD(i,k),否則 ’ (11) 164 ’其中儿"表示平滑因數p之攻擊值^^表示平滑因 數P之衰落值,且“</^。平滑器GC20之另—實施例經組 態以根據諸如以下各者中之一者的線性平滑表達式來對q 個雜訊位準指示中之每一者執行線性平滑操作: M(i, k) <r- k ~ Ο + (1 - Patt )η(ί, k), η(ϊ, k) > η(ΐ, k -1) 1 PdeJldk-l)’ 否則 ’ (12) M(i,k) k _ 工)+ (1 U1^,k),Ή(ί,k) > η(ί,k -1) ’ 1 max[Pde^(i,k-l)^(i,k)]否則 (13)。 平滑器GC20之另一實施例可經組態以在雜訊程度減少 時延遲對q個混合因數中之一或多者(可能所有)的更新。 舉例而言,平滑器CG20可經實施以包括根據由值 hangover—max(i)指定之時間間隔在比率衰落分布期間延遲 更新的搁置邏輯(hangover logic),值hangover_max⑴可在 (例如)一或二至五、六或八之範圍中。可針對每一副頻帶 使用相同hangover一max值,或可針對不同副頻帶使用不同 hangover_max值 ° 混合器X10 0經組態以基於來自混合因數、語音信號S 4 0 及對比加強信號SC10之資訊來產出經處理語音信號S50。 舉例而言,加強器ΕΝ 100可包括混合器X1 〇〇之一實施例,該 實施例經組態以藉由根據諸如P(i,k) = M(i,k)C(i,k) + (1 - M(i,k))S(i,k) 之表達式來將語音信號S40之相應頻域副頻帶與對 140748.doc -52- 201013640 比加強信號SC 10之相應頻域副頻帶混合來產出經處理語音 信號S50之頻域型式,其中p(i,k)指示p(k)之副頻帶i, C(i,k)指示對比加強信號SC10之副頻帶i及訊框k,且S(i,k) 指示語音信號S40之副頻帶i及訊框k。或者,加強器 ΕΝ 100可包括混合器X1 〇〇之一實施例,該實施例經組態 以藉由根據諸如户⑷户(α)之表達式來將語音信號S40 之相應時域副頻帶與對比加強信號SC10之相應時域副頻 帶混合來產出經處理語音信號S50之時域型式,其中 P(i,k) = M(i,k)C(i,k) + (l-M(i,k))S(i,k),1U勾,P(k)指示經處理語 音信號S5〇之訊框k,p(i,k)指示p(k)之副頻帶i,c(i,k)指示 對比加強信號SC10之副頻帶i及訊框k,且s(i,k)指示語音 信號S40之副頻帶i及訊框k。 可希望組態混合器X1 〇〇以基於額外資訊(諸如,固定或 適應性頻率分布)來產出經處理語音信號S50。舉例而言, 可希望應用此頻率分布來補償麥克風或揚聲器之頻率響 應。或者’可希望應用描述使用者選定等化分布之頻率分 布。在此等情況下,混合器Xi〇〇可經組態以根據諸如 p(k) = [L W,P(U)之表達式來產出經處理語音信號S50,其中 值A界定所要頻率加權分布。 圖32展示頻譜對比加強器EN10之實施例EN110的方塊 圖。加強器EN110包括一語音副頻帶信號產生器sgioo, 語音副頻帶信號產生器SG100經組態以基於來自語音信號 S40之資訊來產出一組語音副頻帶信號。如上文所提到, 語音副頻帶信號產生器SG100可實施(例如)為圖26A所示之 140748.doc -53- 201013640 副頻帶信號產生器SG200、圖26B所示之副頻帶信號產生 器SG300或圖26C所示之副頻帶信號產生器8(}4〇〇的例子。 加強器EN110亦包括一語音副頻帶功率估計計算器 spioo,語音副頻帶功率估計計算器8]?1〇〇經組態以產出一 組語音副頻帶功率估計,該等語音副頻帶功率估計各自基 於來自語音副頻帶信號中之相應者的資訊。語音副頻帶功 率估計計算器SP100可實施為圖26D所示之副頻帶功率估 計計算器EC110的例子 舉例而言,可希望將語音副頻帶 信號產生器SG100實施為副頻帶濾波器陣列8(}1〇之提昇實 施例及將語音副頻帶功率估計計算器spi〇〇實施為求和器 EC1〇的經組態以根據表達式(5b)來計算一組q個副頻帶功 率估計的一實施例。另外或其他,語音副頻帶功率估計計 算器S P10 0可經組態以對副頻帶功率估計執行時間平滑操 作。舉例而言,語音副頻帶功率估計計算器81>100可實施 為圖26E所示之副頻帶功率估計計算器£(:12〇的例子。 加強器EN110亦包括:副頻帶增益因數計算sFci〇〇(及 副頻帶混合因數計算器FC200)之實施例?(:3〇〇,其經組態 以基於來自相應雜訊副頻帶功率估計及相應加強副頻帶功 率估計的資訊來計算語音副頻帶信號中之每一者的增益因 數;及一增益控制元件CE110,其經組態以將該等增益因 數中之每一者應用於語音信號S40之相應副頻帶以產出經 處理語音信號S50。明確地提到,至少在致能頻譜對比加 強且加強向量EVH)對增益因數值中之至少―者有貢獻的情 況下,經處理語音信號S50亦可被稱作對比加強語音信號。 140748.doc 54- 201013640 增益因數計算器FC300經組態以基於相應雜訊副頻帶功 率估計及相應加強副頻帶功率估計來計算q個副頻帶中之 每一者的一組增益因數G(i)中之相應者,其中ΐϋ《。圖 33C展示增益因數計算器FC300之實施例FC310的方塊圖, 實施例FC3 10經組態以藉由使用相應雜訊副頻帶功率估計 對相應加強副頻帶功率估計對每一增益因數G⑴之貢獻加 權來計算該增益因數。 增益因數計算器FC3 10包括如上文參考混合因數計算器 © FC200描述之雜訊位準指示計算器NL10的例子。增益因數 计算器FC310亦包括一比率計算器Gcl〇,比率計算器 GC1〇經組態以將語音信號之每一訊框的一組q個功率比率 中之每一者計算為一混和副頻帶功率估計與一相應語音副 頻帶功率估計秘&)之間的比率。舉例而言,增益因數計 算器FC31G可經組態以根據諸如下式之表達式來計算語音 4號之母一訊框的—組q個功率比率中之每一者: ^ G(i,k) = + - i1(U))Es(i,k)
Es(i,k) ’ 1叫, (Η) 其中五似)表示副頻帶z_及訊框㈣由語音副頻帶功率 計算器SPHH)(亦即’基於語音信號州)產出之副頻帶功率 估計’且邮观示副頻帶z•及訊㈣的由加強副頻 估計計算器EP100(亦gp,2全&曰 平 (方即基於加強向量EV10)產出的副頻 帶功率估計。表達式(14彳八 _ 頻 甘 '()之刀子表不一混和副頻帶功率估 3 ’、中’根據相應雜訊位準指示來對語音副頻帶功率估 140748.doc -55· 201013640 计及相應加強副頻帶功率估計之相關貢獻加權。 在另—實例中’比率計算器GC10經組態以根據諸如下 式之表達式來計算語音信號S4〇之每一訊框的該組q個副頻 帶功率估計比率中之至少一者(及可能所有): G(i,k) = Mj))EE (i, k) + (1 - n(i, k))E, (l k)Es(i,k) + s \<i<q ^ (15) 其中ε為具有小之正值(亦即,小於Es(ik)之預期值的值)的 調諧參數。可希望比率計算器GC1〇之此實施例針對所有 sJ頻帶使用相同之調諸參數£值。或者,可希望比率計算 _ 器GC10之此實施例針對副頻帶中之兩者或兩者以上(可能 所有)中之每一者使用不同之調諧參數8值。調諧參數ε之值 (或多個值)可為固定的或可隨著時間過去而加以調適(例 如,自一個訊框至下一個訊框)。調諧參數£之使用可有助 於在比率計算器GC10中避免被零除之錯誤的可能性。 增益因數計算器FC3 10亦可經組態以對q個功率比率中之 一或多者(可能所有)中之每一者執行平滑操作。圖33D展 不增益因數計算器FC310之此實施例FC32〇的方塊圖,實 施例FC320包括平滑器GC2〇之經配置以對由比率計算器 . GC10產出之q個功率比率中之一或多者(可能所有)中之每 者執行時間平滑操作的例子GC25。在一個此種實例 中,平滑器GC25經組態以根據諸如下式之表達式來對q個 功率比率中之每一者執行線性平滑操作: G(i,k) <-pG(i,k-1) + (1-p)G(i,k) > \<i<q ,
140748.doc _ efL (16) 201013640 其令β為平滑因數。在此實例争,平滑因數β具有 千滑)至—(最大平滑,不更新)之範圍中的值(例如,03、 〇.5、〇.7、〇.9、0_99或0.999)。 〇.3
鲁 之滑器GC25取決於增益因數之當前值與先前值 一、關係來在平滑因數β之兩個或兩個以上之值中選擇 。因A,可希望,較之在增益因數之當前值大於先前 值時的平滑因㈣之值,平滑因數k值在增_數之#前 值小於S前值時較A。在—個此種實例中,平滑器⑽5 經組態以㈣諸如下式之表達絲對q個㈣比料之每 一者執行線性平滑操作: G(i, k)^\^G(is k - J) + (1 - Pa„ )G(i, k), G(i, k) > G(i, k -1) IGGHHdiJGak),否則 ’ (17) 其中1叫’其中火"表示平滑因數仏 滑帽之«m 經組態以根據諸如以下各者令之一者的線性平滑表達式來 對q個功率比率中之每__者執行線性平滑操作: G(i,k) J^G^k~^+(1-β3«)G(i,k), G(i,k)> G(i,k-1) L PdecG(i,k-否則 ,(18) GM>o^ 否則 (19) 另外或其他’表達式(17)_(19)可經實施以基於雜訊位準指 示之間的關係(例如,根據表達式KuXk-i)之值)來在p 之值當中進行選擇。 140748.doc -57- 201013640 圖34A展不根據上述表達式(⑸及⑽描述此平滑之 例的偽碼列表,其可針對訊框續之每-副頻帶/而加以執 丁在此列表中,計算雜訊位準指示之當前值且將增益 因數之當前值初始化為混和副頻帶功率與原始語音心帶 功率之比率。若此比率小於增益因數之先前值,則藉由按 具有小於—之值的標度因數心、—來按比例縮小先前值 來:算增益因數之當前值。否則,使用具有在零(不平滑) 至一(最大平滑,不更新)之範圍中的值(例如,0.3、〇.5、 〇·^、0.9、〇.99或〇.999)之平均因數心匕―扣來將增益因數 之當前值計算為該比率與增益因數之先前值之平均值。 平滑器GC25之另一實施例可經組態以在雜訊程度減少 時延遲對q個增益因數中之一或多者(可能所有)的更新。圖 34B展不可用以實施此微分時間平滑操作的圖34a之偽碼 歹J表的修改。此列表包括根據由值hang〇ver—max(i)指定之 時間間隔在比率衰落分布期間延遲更新的擱置邏輯,值 hangover_max⑴可在(例如;)一或二至五、六或八之範圍 中"T針對母一副頻帶使用相同hang over 一max值,或可針 對不同副頻帶使用不同hangover_max值。 如本文所描述的增益因數計算器FC100或FC300之實施 例可經進一步組態以將上界及/或下界應用於增益因數中 之一或多者(可能所有)。圖35A及圖35B分別展示可用以將 此上界UB及下界LB應用於增益因數值中之每一者的圖3 4A 及圖34B之偽碼列表的修改。此等界限中之每一者的值可 為固定的。或者,可根據(例如)加強器EN10之所要邊限及/ 140748.doc -58 - 201013640 或經處理語音信號S50之當前音量(例如,音量控制信號 VS10之當前值)來調適此等界限中之任一者或兩者的值: 另外或其他,此等界限中之任一者或兩者的值可基於來自 語音信號S40之資訊(諸如,語音信號S4〇之當前位準)。 增益控制元件CE 110經組態以將增益因數中之每一者應 用於浯音k號S40之相應副頻帶(例如,將增益因數作為增 益因數向量來應用於語音信號S4〇)以產出經處理語音信號 S50。增益控制元件CE110可經組態以(例如)藉由將語音信 ^ 號S40之訊框的頻域副頻帶中之每一者乘以相應增益因數 G⑴來產出經處理語音信號S50之頻域型式。增益控制元 件CE110之其他實例經組態以使用重疊相加或重疊儲存方 法來將增益因數應用於語音信號S4〇之相應副頻帶(例如, 藉由將增益因數應用於一合成濾波器組之各別濾波器)。 增益控制元件CE110可經組態以產出經處理語音信號 S50之時域型式。圖36A展示增益控制元件€£11〇之此實施 ❹ 例CE115的方塊圖,實施例CE115包括一具有一帶通濾波 器陣列之副頻帶濾波器陣列FA100,該等帶通濾波器各自 經組態以將增益因數中之各別者應用於語音信號S4〇之相 應時域副頻帶。此陣列中之濾波器可並列地及/或串列地 配置。在一實例中’陣列FA100實施為一小波或多相合成 濾、波器組。加強器EN11〇之包括增益控制元件CE11〇之時 域實施例且經組態以將語音信號S4〇作為頻域信號接收的 實施例亦可包括逆變換模組TR20之經配置以將語音信號 S40之時域型式提供給增益控制元件CE110的例子。 140748.doc •59· 201013640 圖36B展示副頻帶濾波器陣列FA 100的包括並列地配置 之一組q個帶通濾波器F20-1至F20-q之實施例FA110的方塊 圖。在此種情況下,濾波器F20-1至F20-q中之每一者經配 置以藉由根據增益因數對副頻帶進行慮波來將q個增益因 數G(l)至G(q)(例如,藉由增益因數計算器FC300計算)中之 相應者應用於語音#號S40之相應副頻帶以產出相應帶通 信號。副頻帶滤波器陣列FA 110亦包括經組態以混合q個帶 通信號以產出經處理語音信號S 5 0的組合器MX 10。 圖37A展示副頻帶濾波器陣列FA100之另一實施例FA120 的方塊圖’其中帶通遽波器F20-1至F20-q經配置以藉由根 據增益因數串列地(亦即,在一級聯中,使得每一濾波器 F20-k經配置以對濾波器F20-(k-l)之輸出進行渡波, 2^:4)對語音信號S40進行濾波來將增益因數 中之每一者應用於語音信號S40之相應副頻帶。 渡波器F20-1至F20-q中之每一者可經實施以具有一有限 脈衝響應(FIR)或一無限脈衝響應(IIR)。舉例而言,遽波 器F2〇-l至F2〇-q中之一或多者(可能所有)中之每一者可實 細•為雙一階渡波器。舉例而言’副頻帶渡波器陣列ρ a 12 〇 可實施為雙二階濾波器之級聯。此實施例亦可被稱作雙二 階IIR濾、波器級聯、一階HR區段或渡波器之級聯,或級聯 式之一連串副頻帶IIR雙二階濾波器。可希望使用轉置直 接形式π來實施每一雙二階濾波器,尤其對於加強器ENi〇 之浮點實施例而言。 可希望濾波器F20-1至F20-q之通頻帶表示將語音信號 140748.doc •60- 201013640 ΓΛ頻寬劃分成—組非均1頻帶(例如,使得錢器通 4 之兩者或兩者以上具有不同寬度)而非-組均-副 :中(例如,使得慮波器通頻帶具有相等宽度)。如上文 :提到’非均一副頻帶劃分方案之實例包括先驗方案(諸 基於巴克標度之方案)或對數方案(諸如,基於梅爾標 案)舉例而s,可根據由圖27中之點說明的巴克 標度劃分方案來組態渡波器咖]至隱q。此副頻帶配置 Φ ❹ :用於寬頻帶語音處理系統(例如’具有16他之取樣速 率的器件)中。在此劃分方案之其他實财,省略最低副 頻帶以獲得,、剎頻帶方案,及/或將最高副頻帶之上限自 7700 Hz增加至 8000 Hz。 。在乍頻帶„吾音處理系統(例如,具有8之取樣速率的 器件)中可希望根據具有少於六個或七個副頻帶之劃分 方案來5又计濾波器之通頻帶。此副頻帶劃分 方案之#例為四頻帶準巴克方案则_51〇沿、別㈣
Hz 920 1480 Hz及1480-4000 Hz。使寬高頻率頻帶(例 如如在此實例中)可為所要的,itb #由於低副頻帶能量 估。十及/或為了處理用雙二階濾波器模擬最高副頻帶過程 中的困難。 可使用增益因數G(1)至G(q)中之每一者來更新渡波器 F20-1至F2G-q中之相應者之_或多個滤波器係數值。在此 種情況下,可希望組態濾波器F20-1至F20-q中之一或多者 (可能所有)中之每一者,使得其頻率特性(例如,中心頻率 及其通頻帶之寬度)為固定的且其增益為可變的。可藉由 140748.doc •61 - 201013640 按一共同因數(例如,增益因數G(1)至G(q)中之相應者的卷 前值)來僅改變前饋係數(;例如,上述雙二階表達式(1)中2 係數bG、卜及匕)之值來針對FIR或IIR濾波器來實施此技 術。舉例而言,可根據增益因數G(1)至G(q)中之相廡者 G(i)之當前值來改變濾波器F20·1至F20-q中之—#F2〇 1的 雙二階實施例中的前饋係數中之每一者的值以獲得以下轉 移函數: w (7)-钟)13。(0 + G(i)b, (ip + G(i)b2 (i)z-2 〇 l + a,^'1 +a2(i)z-2 (20) 圖37B展示濾波器F2〇-l至F20-q中之一者F20-i的雙二階實 施例的另一實例,其中根據相應增益因數G⑴之當前值來 改變濾波器增益。 可希望實施副頻帶濾波器陣列FA1 00,使得在所有增益 因數G(l)至G(q)等於一時,副頻帶濾波器陣列FAi〇〇在相 關頻率範圍(例如,自50 Hz、100 Hz或200 Hz至3000 Hz、 3500 Hz、4000 Hz、7000 Hz、7500 Hz 或 8000 Hz)内之有 效轉移函數大體上恆定。舉例而言,可希望在所有增益因 數G(l)至G(q)等於一時,副頻帶濾波器陣列fA100之有效 轉移函數在該頻率範圍之百分之五、百分之十或百分之二 十(例如,0.25、0.5或一分貝内)為恆定。在一特定實例 中,在所有增益因數G(l)至G(q)等於一時,副頻帶濾波器 陣列FA100之有效轉移函數大體上等於一。 可希望副頻帶濾波器陣列FA100將相同副頻帶劃分方案 140748.doc 62· 201013640 作為語音副頻帶信號產生器SGI 00之副頻帶濾波器陣列 SG10的實施例及/或加強副頻帶信號產生器EG100之副頻 帶濾波器陣列SG10的實施例來應用。舉例而言’可希望副 頻帶濾波器陣列FA100使用具有與此濾波器或此等濾波器 之設計(例如’一組雙二階濾波器)相同的設計的一組濾波 器’其中將固定值用於該副頻帶濾波器陣列或多個陣列 SG10的增益因數。可甚至使用與此副頻帶濾波器陣列或多 個陣列相同之分量濾波器來實施副頻帶濾波器陣列 FA1 00(例如’在不同時間,用不同增益因數值,且可能用 不同地配置之分量濾波器,如在陣列FA120之級聯中)。 可希望根據穩定性及/或量化雜訊考慮來設計副頻帶濾 波器陣列FA100。舉例而言,如上文所提到,副頻帶濾波 器陣列FA 120可實施為二階區段(secon(j-order section)之級 聯。使用轉置直接形式Π雙二階結構實施此區段可有助於 最小化捨入雜訊及/或在該區段内獲得強健係數/頻率敏感 性。加強器ΈΝ10可經組態以對濾波器輸入及/或係數值執 行按比例調整,此可有助於避免溢出情形。加強器ΕΝ i 〇 可經組態以執行心智檢查操作,該心智檢查操作在濾波器 輸入與輸出之間存在大差異之情況下重設副頻帶濾波器陣 列FA100之一或多個IIR濾波器的歷史記錄。數值實驗及線 上測試已導致以下結論,可在無用於量化雜訊補償之任何 模組的情況下實施加強器EN10 ’但亦可包括一或多個此 等模組(例如’經組態以對副頻帶濾波器陣列FA1〇〇之一或 多個濾波器中之每一者的輸出執行顫化操作的模組)。 140748.doc -63 - 201013640 如上文所描述’可使用適合於提昇語音信號請之各別 *1頻帶的刀量濾波器(例如,雙二階)來實施副頻帶渡波器 陣列FA100。$而,在—些情況下,亦可希望使語音信號 S40之或多個副頻帶相對於語音信號S4〇之其他副頻帶衰 咸舉例而。,可希望放大一或多個頻譜峰值且亦希望使 一或多個頻譜谷值衰減。此衰減可藉由根據訊框之最大所 要衰減來在副頻帶濾波器陣列FA100上游使語音信號S4〇衰 減且相應地增加其他副頻帶之訊框的增益因數之值以補償 該哀減來執行。舉例而言,副頻帶丨衰減兩分貝可藉由在 副頻帶濾波器陣列FA100上游使語音信號S4〇衰減兩分貝、 使副頻帶1在無提昇之情況下通過陣列FA1〇〇,及使其他副 頻帶之增益因數的值增加兩分貝來實現。作為在副頻帶濾 波器陣列FA 1 00上游將衰減應用於語音信號S4〇的替代例, 可在副頻帶濾波器陣列FA100下游將此衰減應用於經處理 5吾音信號S 5 0。 圖3 8展示頻譜對比加強器EN丨〇之實施例en丨2〇的方塊 圖。與加強器EN110相比,加強器EN120包括增益控制元 件CE100之實施例CE12〇,實施例CE12〇經組態以處理由語 音副頻帶信號產生器SG100自語音信號S40產出之一組(^固 副頻帶信號S(i)。舉例而言’圖39展示增益控制元件 CE120之實施例CE130的方塊圖,實施例CE130包括副頻帶 增益控制元件〇20-1至〇2〇4之陣列及組合器皿又1〇之例 子。該q個副頻帶增益控制元件G20-1至G20-q中之每一者 (其可實施為(例如)乘法器或放大器)經配置以將增益因數 140748.doc • 64_ 201013640 G(l)至G(q)中之各別者應用於副頻帶信號3(1)至3((1)中之 各別者。組合器MX10經配置以組合(例如,混合)增益受控 副頻帶信號以產出經處理語音信號S5〇。 對於加強器EN100、EN110或EN120將語音信號S40作為 變換域信號(例如,作為頻域信號)來接收之情況,相應增 益控制元件CE100、CE110或CE120可經組態以將增益因數 •‘ 應用於變換域中之各別副頻帶。舉例而言,增益控制元件 CE100、CE110或CE120之此實施例可經組態以使每一副頻 參 帶乘以該等增益因數中之相應者,或使用對數值來執行類 似運算(例如,將增益因數與副頻帶值相加(以分貝為單 位))。加強器EN100、EN110或EN120之替代實施例可經組 態以在增益控制元件上游將語音信號S4〇自變換域轉換至 時域。 可希望組態加強器EN10以使語音信號S40之一或多個副 頻帶在無提昇之情況下通過。舉例而言,低頻率副頻帶之 提昇可導致對其他副頻帶之壓抑,且可希望加強器eN10 使語音信號S40之一或多個低頻率副頻帶(例如,包括小於 3 00 Hz之頻率的副頻帶)在無提昇之情況下通過。 舉例而言’加強器EN100、EN110或EN120之此實施例 可包括增益控制元件CE100、CE110或CE120的經組態以使 一或多個副頻帶在無提昇之情況下通過的實施例。在一個 此種情況下’可實施副頻帶濾波器陣列FA 11 〇,使得副頻 帶濾波器F20-1至F20-q中之一或多者應用增益因數一(例 如,零dB)。在另一個此種情況下,副頻帶濾波器陣列 140748.doc -65- 201013640 FA120可實施為比濾波器F2〇-i至F20-q之所有少的級聯。 在另外一個此種情況下,可實施增益控制元件CE100或 CE120 ’使得增益控制元件G20_l至G20-q中之一或多者應 用增益因數一(例如,零dB)或以其他方式組態以使各別副 頻帶信號在不改變其位準之情況下通過。 可希望避免加強語音信號S40之僅含有背景雜訊或為寂 靜的部分之頻譜對比。舉例而言,可希望組態裝置A! 〇〇以 在語音信號S40無作用之時間間隔期間繞過加強器en1〇或 以其他方式延緩或抑制語音信號S40之頻譜對比加強。裝 置A100之此實施例可包括話音活動偵測器(VAD),話音活 動偵測器(VAD)經組態以基於一或多個因數(諸如,訊框能 量、信雜比、週期、語音及/或殘差之自相關(例如,線性 預測編碼殘差)、過零率及/或第一反射係數)來將語音信號 S40之訊框分類為有作用(例如,語音)或無作用(例如,背 景雜訊或寂靜)。此分類可包括將此因數之值或量值與一 臨限值進行比較及/或將此因數之改變的量值與臨限值進 行比較。 圖40A展示裝置A100之包括此VAD V10之實施例幻6〇的 方塊圖。話音活動偵測器V10經組態以產出一更新控制信 號S70,其狀態指示針對語音信號S40是否彳貞測到語音活 動。裝置A160亦包括加強器EN10(例如,加強器eni 1〇或 ΕΝ120)之實施例ΕΝ150,實施例ΕΝ150係根據更新控制信 號S70之狀態來控制。加強器ΕΝ10之此實施例可經組態, 使得在未偵測到語音的語音信號S40之時間間隔期間,抑 140748.doc • 66 - 201013640 制增益因數值之更新及/或雜訊位準指示η之更新。舉例而 言,加強器ΕΝ150可經組態,使得增益因數計算器FC300 針對語音信號S40之未偵測到語音的訊框輸出增益因數值 的先前值。 在另一實例中,加強器ΕΝ1 50包括 ❹ FC300之一實施例,該實施例經組態以在VAD vi 〇指示語 音信號S40之當前訊框無作用時迫使增益因數之值為中性 值(例如’指示無來自加強向量EV10之貢獻或為零分貝之 增益因數)或迫使增益因數之值在兩個或兩個以上之訊框 内衰落至中性值。另外或其他’加強器ΕΝ150可包括增益 因數"十算器FC3 00之一實施例,該實施例經組態以在vad VI0指示語音信號S4〇之當前訊框無作用時將雜訊位準指示 η之值設定為零,或允許雜訊位準指示之值衰落至零。 話音活動偵測器V10可經組態以基於一或多個因數(諸 如,訊框能量、信雜比(SNR)、週期、過零率、語音及/或 殘差之自相關及第一反射係數)來將語音信號S40之訊框分 類為有作用或無作用(例如,控制更新控制信號S70之二元 狀態)。此分類可包括將此因數之值或量值與一臨限值進 行比較及/或將此因數之改變的量值與臨限值進行比較。 另外或其他,此分類可包括將在一頻率頻帶中此因數(諸 如,龅量)之值或量值或此因數之改變的量值與另一頻率 頻帶中之類似值進行比較。可希望實施VAD V1Q以基於多 個準則⑽如,能量、過零率等等)及/或近來VAD決策之吃 憶來執行話音活動偵測。可由御V1峨行的話音活動價 140748.doc •67- 201013640 測操作之一實例包括將語音信號S40之高頻帶及低頻帶能 量與各別臨限進行比較,如描述(例如)於2007年1月之題為 「Enhanced Variable Rate Codec, Speech Service Options 3, 68,and 70 for Wideband Spread Spectrum Digital Systems」 的 3GPP2 文件 C.S0014-C,vl.O之部分 4.7(第 4-49 頁至 4-57 頁)中(在www-dot-3gpp-dot-org處線上可獲得)。話音活動 偵測器VI0通常經組態以將更新控制信號S70產出為二元值 話音偵測指示,但產出連續及/或多值信號之組態亦為可 能的。 裝置A110可經組態以包括話音活動偵測器γιο的實施例 v 1 5 ’實施例VI 5經組態以基於雜訊減少級NR20之輸入與 輸出之間的關係(亦即’基於源信號S2〇與雜訊減少語音信 號S45之間的關係)來將源信號S20之訊框分為有作用或無 作用的。可認為此關係之值指示雜訊減少級NR2〇之增 益。圖40B展示裝置A140(及裝置A160)之實施例A165的方 塊圖。 在一實例中,VAD V15經組態以基於通過級NR2〇之頻域 頻格的數目來指示訊根是否為有作用的。在此種情泥下, 更新控制信號S70指示訊框在所通過頻格之數目超過(或 者,不小於)一臨限值時為有作用的且否則為無作用的。 在另一實例中,VAD ¥15經組態以基於由級]^112〇阻斷之頻 域頻格的數目來指示訊框是否為有作用的。在此種情況 下,更新控制信號S70指示訊框在所阻斷頻格之數目超過 (或者,不小於)一臨限值時為無作用的且否則為有作用 140748.doc -68- 201013640 的。在判定訊框為有作用或無作用期 m 土占 J布望VAD V15 僅考慮更有可能含有語音能量之頻格,諸如低頻率之頻格 (例如,含有不高於-千赫、-千五百赫或兩千赫之頻率 值的頻格)或中間頻率之頻格(例如,含有不小於兩百赫、 二百赫或五百赫之頻率值的低頻率之頻格
圖展示圖35A之偽碼列表的修改,其中變數vad(例 如,更新控制信號S70)之狀態在語音信號S4〇之當前訊框 為有作用的時為丨且否則為〇。在此實例(其可藉由增益因 數計算器FC300之相應實施例執行)中,將副頻帶认訊框免 之副頻帶增益因數之當前值初始化為最近之值,且對於無 作用訊框,不更新副頻帶增益因數之值。圖42展示圖ΜΑ 之偽碼列表的另一修改,其中在未偵測到話音活動之週期 期間(亦即,對於無作用訊框)副頻帶增益因數之值衰落至 了希望在別處將VAD V10之一或多個例子應用於裝置 A100中。舉例而言,可希望配置VAD ¥1〇之一例子以對以 下L號中之一或多者偵測語音活動:所感測音訊信號$⑺ 之至少一頻道(例如,主要頻道)、經濾波信號S1 5之至少 一頻道,及源信號S20。可使用相應結果來控制SSP濾波器 SS20之適應性濾波器af10的操作。舉例而言,可希望組 態裝置A1 〇〇以在此話音活動偵測操作之結果指示當前訊框 為有作用的時啟動適應性濾波器AF10之訓練(例如,調 適)’增加適應性濾波器AF10之訓練速率,及/或增加適應 性渡波器AF10之深度,及/或否則關閉訓練及/或減少此等 140748.doc • 69· 201013640 值。 可希望組態裝置A100以控制語音信號S40之位準。舉例 而言,可希望組態裝置A100以控制語音信號S40之位準以 提供足夠邊限來適應由加強器EN10進行之副頻帶提昇 的。另外或其他,可希望組態裝置A100以如上文參考增益 因數計算器FC300所揭示基於關於語音信號S40之資訊(例 如,語音信號S40之當前位準)來判定雜訊位準指示邊界 Tlmin及Tlmax中之任一者或兩者的值及/或增益因數值邊界XJB 及LB中之任一者或兩者的值。 圖43A展示裝置A100之實施例A170的方塊圖,其中加強 器EN10經配置以經由自動增益控制(AGC)模組G10來接收 語音信號S40。自動增益控制模組G10可經組態以根據已知 或將開發之任何AGC技術來將音訊輸入信號S100之動態範 圍壓縮至受限振幅帶中以獲得語音信號S40。自動增益控 制模組G10可經組態以藉由(例如)提昇輸入信號之具有低 功率的區段(例如’訊框)及使輸入信號之具有高功率的區 段衰減來執行此動態範圍壓縮。對於語音信號S40為再生 音訊信號(例如’遠端通信信號、連續播送之音訊信號或 來自所儲存媒體檔案之經解碼信號)的應用中,裝置A170 可經配置以自解碼級接收音訊輸入信號S100。如下文所描 述之通信器件D1 0 0的相應例子可經構造以包括亦為裝置 A170之實施例(亦即’包括AGC模組G10)的裝置A100之實 施例。對於加強器EN10經配置以將源信號S20作為語音信 號S40來接收(例如,如在上文所描述之裝置A11〇中)的應 140748.doc • 70· 201013640 用,音訊輸入信號S100可基於所感測之音訊信號sl〇。 自動增益控制模組G10可經組態以提供邊限界定及/或主 音量設定。舉例而言,AGC模組G10可經組態以將如上所 揭示之上界UB及下界LB中之任一者或兩者的值及/或如上 所揭示之雜訊位準指示邊界如化及η^χ中之任一者或兩者 的值提供給加強器ΕΝ10。AGC模組G10之操作參數(諸 如,壓縮臨限及/或音量設定)可限制加強器EN10之有效邊 限。可希望調諧裝置A100(例如,調諧加強器EN10及/或 AGC模組Gl〇(若存在)),使得在所感測音訊信號si〇缺乏 雜訊之情況下,裝置A100之淨效應大體上無增益放大(例 如,語音信號S40與經處理語音信號S5〇之間的位準差異小 於約加或減百分之五、百分之十或百分之二十)。 時域動態範圍壓縮可藉由(例如)隨著時間過去使信號之 改變的可感知性增加來增加信號可懂度。此信號改變之一 特定實例涉及隨著時間過去清楚界定之共振峰軌跡的存 ❹在’此可顯著有助於信號之可懂度。通常藉由子音尤其閉 塞子音(例如,[k]、⑴、[p]等等)來標記共振峰軌跡之開始 及結束點。與語音之元音内容及其他有聲部分相比,此等 標記輔音通常具有低能量。提昇標記辅音之能量可藉由允 許收聽者更清楚地跟隨語音開始及結束來增加可僅度。可 懂度之此增加不同於可經由頻率副頻帶功率調整來獲得的 可懂度增加(例如,如本文中參考加強器ENH)來描述)。因 此,採用此等兩個效應之間的協作(例#,如上文所描 述在裝置A170之實施例中,及/或在對比加強信號產生 140748.doc 201013640 器EG110之實施例EG120中)可允許總體語音可懂度之可觀 增加。 "T希望組態裝置A10 0以進一步控制經處理語音信號s 5 〇 之位準。舉例而言,裝置A100可經組態以包括經配置以控 制經處理語音信號S50之位準的AGC模組(另外或其他, AGC模組G10)。圖44展示加強器EN20之實施例EN160的方 塊圖’實施例ΕΝ 160包括經配置以限制頻譜對比加強器之 聲輸出位準的峰值限制器L10。峰值限制器li〇可實施為可 變增益音訊位準壓縮器。舉例而言,峰值限制器L丨〇可經 組態以將高峰值壓縮至臨限值,使得加強器Εν 160達成組 合頻譜對比加強/壓縮效應。圖43Β展示裝置八100之實施例 Α180的方塊圖’實施例Α180包括加強器ΕΝ160以及AGC模 組 G1 0。 圖45Α之偽碼列表描述可由峰值限制器L10執行的峰值 限制操作的一實例。對於輸入信號sig之每一樣本k(例如, 對於經處理語音信號S50之每一樣本k),此操作計算樣本 量值與軟峰值限制peak lim之間的差異pkdiff。peak_lim之 值可為固定的或可隨著時間過去而加以調適。舉例而言, peak_lim之值可基於來自AGC模組G10之資訊。此資訊可 包括(例如)以下各者中之任一者:上界UB及/或下界LB之 值、雜訊位準指示邊界rimin及/或η„^χ之值、與語音信號S4〇 之當前位準有關的資訊。 若pkdiff之值至少為零,則樣本量值不超過峰值限制 peak_lim。在此種情況下,將微分增益值diffgain設定為 140748.doc -72- 201013640 一。否則,樣本量值大於峰值限制peak_lim,且將diffgain 設定為與超過量值成比例的小於一之值。 峰值限制操作亦可包括對微分增益值之平滑。此平滑可 根據增益係隨著時間過去增加還是減少而不同。如圖45 A 所示’舉例而言,若diffgain之值超過峰值增益參數§_?]<: 之先前值,.則使用g_pk之先前值、diffgain之當前值及攻 擊增益平滑參數gamma_att來更新g_pk之值。否則,使用 g_pk之先前值、diffgain之當前值及衰落增益平滑參數 gamma一dec 來更新 g_pk之值。值 gamma_att及 gamma_dec係 選自約零(不平滑)至約0.999(最大平滑)之範圍。接著使輸 入號Slg之相應樣本k乘以g_pk之經平滑值以獲得峰值受 限樣本。 圖45B展示圖45A之偽碼列表的修改,其使用不同表達 式來計算微分增益值diffgain。作為此等實例之替代例, 峰值限制器L10可經組態以執行如圖45A或圖45B中所描述 之峰值限制操作的另一實例,其中較不頻繁地更新pkdiff 之值(例如,其中將pkdiff之值計算為peak—lim與信號sig之 若干個樣本之絕對值的平均值之間的差異)。 如本文所提到’一通信器件可經構造以包括裝置A1〇〇之 實施例在此器件之操作期間的一些時間處,可希望裝 置AH)〇根據來自不同於雜訊參考㈣之參考的資訊來加強 語音信號S40之頻譜對比。在一些環境或定向+,例如,
SSP濾波器SS10之方I 万向性處理刼作可產出不可靠之結果。 在器件之㈣作模式(諸如,即按即說(PTT)模式或揚聲 140748.doc -73· 201013640 器電话模式)下’所感測音訊頻道之空間選擇性處理可為 =要或非所要的。在此等情況下,可希望Wo在ί 二頻道」)模式而非空間選擇性(或「多頻道」) ,裝置AUH)之—實施例可經組態以根據—模式選擇信號之 S前狀態來在單頻道模式或多頻道模式下操作。裝置Α刚 之此實施例可包括分離評估器,分離評估器經組態以基於 所感測音訊信號810、源信號S2〇及雜訊參考s3〇中之至少 一者的品質來產出模式選擇信號(例如,二元旗標)。由1 分離評估器用於判定模式選擇信號之狀態的準則可包括以 下參數中之-或多者的t前值與相應臨限值之間的關係: 源信號S20之能量與雜訊參考S3〇之能量之間的差異或比 率;雜訊參考S30之能量與所感測音訊信號sl〇之一或多個 頻道之能量之間的差異或比率;源信號S2〇與雜訊參考s3〇 之間的相關性;源信號S20載有語音之可能性,如由源信 號S20之一或多個統計度量(例如,峰態、自相關)指示。 在此種情況下,可將信號之能量的當前值計算為該信號之 連續樣本之一區塊(例如,當前訊框)的平方樣本值之總 和° 裝置A100之此實施例A200可包括一分離評估器Ev丨〇, 分離評估器EV10經組態以基於來自源信號S2〇及雜訊參考 S30之資訊(例如,基於源信號S2〇之能量與雜訊參考s3〇之 能量之間的差異或比率)來產出模式選擇信號S8〇。此分離 評估器可經組態以產出模式選擇信號S8〇以在其判定ssp滤 140748.doc •74· 201013640 波is SS10已將一所專盤立八臬/ 71聲a刀置(例如,使用者之話音)充分 地分離至源信號S2〇中時具有—第一狀態且否則具有一第 -狀s㈤此種實例中’分離評估器£乂1〇經、组態以 在其判定源信號S20之當前能量與雜訊參考㈣之當前能量 之間的差異超過(或者,不小於)相應臨限值時指示充分分 離在另-個此種實例中,分離評估器£乂1〇經組態以在 ; 其判定源信號S2〇之當前訊框與雜訊參考S30之當前訊框之 $的相關性不小於(或者’不超過)相應臨限值時指示充分 罾 分離。 裝置Α100之包括分離評估器EV1 〇之一例子的一實施例 Y經組態以在模式選擇信號S8〇具有第二狀態時繞過加強 器EN10。此配置(例如)對於加強器ENi(^^組態以將源信 號S20作為語音信號來接收的裝置Au〇之一實施例而言可 為所要的。在一實例中,藉由迫使彼訊框之增益因數為中 性值(例如,指示無來自加強向量Ενι〇之貢獻,或零分貝 參之增益因數)使得增益控制元件CE100、CE110或CE120使 語音信號S40在無改變之情況下通過來執行繞過加強器 • ΕΝ10。可突然地或逐漸地(例如,兩個或兩個以上之訊框 内的衰落)實施此迫使。 圖46展示裝置Α100的包括加強器ΕΝ1〇之實施例即2〇〇的 替代實施例Α200的方塊圖。加強器ΕΝ2〇〇經組態以在模式 選擇彳§號880具有第一狀態時在多頻道模式下操作(例如, 根據上述加強器ΕΝ10之實施例中之任一者)及在模式選擇 信號S80具有第二狀態時在單頻道模式下操作。在單頻道 140748.doc •75· 201013640 模式下,加強器EN200經組態以基於來_未經分離之雜訊 參考S95之一組副頻帶功率估計來計算增益因數值G(1)至 G(q)。未經分離之雜訊參考S95係基於未經分離之所感測 音訊信號(例如’基於所感測音訊信號Sl〇之一或多個頻 道)。 可實施裝置A200 ’使得未經分離之雜訊參考S95為所感 測音訊頻道S10-1及S10-2中之一者。圖47展示裝置A200之 此實施例A210的方塊圖’其中未經分離之雜訊參考S95為 所感測音訊頻道S1 0-1。可希望裝置A200經由回音消除器 或經組態以對麥克風信號執行回音消除操作的其他音訊預 處理級(例如,如下文所描述之音訊預處理器AP20的例子) 來接收所感測音訊頻道S 10,尤其對於語音信號S40為再生 音訊信號之情況而言。在裝置A200之更一般實施例中,未 經分離之雜訊參考S95為未經分離之麥克風信號(例如,如 下文所描述之類比麥克風信號SM10-1及SM10-2中之任— 者,或如下文所描述之數位化麥克風信號DM1〇_1&DMl〇_ 2中之任一者)。 可實施裝置A200 ’使得未經分離之雜訊參考S95為所感 測音訊頻道S10-1及S10-2中對應於通信器件之主要麥克風 (例如’通常最直接地接收使用者之話音的麥克風)的特定 者。此配置(例如)對於語音信號S40為再生音訊信號(例 如’遠端通信信號、連續播送之音訊信號或來自所儲存媒 體檔案之經解碼信號)的應用而言可為所要的。或者可 實施裝置A200 ’使得未經分離之雜訊參考S95為所感測音 140748.doc -76- 201013640 訊頻道S10-1及S10-2中對應於通信器件之次要麥克風(例 如,通常僅間接地接收使用者之話音的麥克風)的特定 者。此配置(例如)對於加強器EN10經配置以將源信號s2〇 作為語音信號S40來接收的應用而言可為所要的。 在另一配置中’裝置A200可經組態以藉由將所感測音訊 頻道S10-1及S10-2混合至單一頻道來獲得未經分離之雜訊 參考S95。或者,裝置A2〇〇可經組態以根據一或多個準則 (諸如’最高信雜比、最大語音可能性(例如,由一或多個 統計度量指示)、通信器件之當前操作組態,及/或所要源 信號被判定所發自之方向)來自所感測音訊頻道Swq及 S 10-2中選擇未經分離之雜訊參考S95。 更一般地,裝置A200可經組態以自一組兩個或兩個以上 麥克風信號(諸如,如下文所描述之麥克風信號SMiOq及 SM10-2或如下文所描述之麥克風信號及DM10-2) 獲得未經分離之雜訊參考S95。可希望裝置A2〇0自已經受 回音消除操作(例如,如下文參考音訊預處理器AP2〇及回 音消除器EC 10所描述)之一或多個麥克風信號來獲得未經 分離之雜訊參考S95。 裝置A200可經配置以接收來自時域緩衝器之未經分離之 雜訊參考S95。在一個此種實例令,時域緩衝器具有十毫 秒之長度(例如,在8 kHz之取樣速率下的八十個樣本或在 16 kHz之取樣速率下的160個樣本)。 加強器EN200可經組態以根據模式選擇信號s8〇之狀態 基於雜訊參考S30及未經分離之雜訊參考S95中之一者來產 H0748.doc •77· 201013640 生一組第二副頻帶信號。圖48展示加強器EN200(及加強器 EN110)之此實施例EN3 00的方塊圖,實施例EN300包括一 選擇器SL10(例如,解多工器),選擇器SL1〇經組態以根據 模式選擇信號S80之當前狀態來選擇雜訊參考S30及未經分 離之雜訊參考S95中之一者。加強器EN300亦可包括增益 因數计算器FC300之一實施例,該實施例經組態以根據模 式選擇彳§號S80之狀態來在邊界rjmin及中之任一者或兩 者及/或邊界UB及LB中之任一者或兩者的不同值中進行選 擇。 加強器ΕΝ200可經組態以根據模式選擇信號S80之狀態 在不同副頻帶信號組中進行選擇以產生該組第二副頻帶功 率估計。圖49展示加強器ΕΝ300之此實施例ΕΝ310的方塊 圖’實施例ΕΝ3 10包括副頻帶信號產生器NG100之第一例 子NGlOOa、副頻帶信號產生器NG100之第二例子 NGlOOb ’及選擇器SL20。第二副頻帶信號產生器 NG 100b(其可實施為副頻帶信號產生器SG200之例子或實 施為副頻帶信號產生器SG300之例子)經組態以產生一組副 頻帶信號’其係基於未經分離之雜訊參考S95。選擇器 SL20(例如,解多工器)經組態以根據模式選擇信號S8〇之 當前狀態來在由第一副頻帶信號產生器NGlOOa及第二副 頻帶信號產生器NG100b產生之多組副頻帶信號中選擇一 者且將該選定組之副頻帶信號提供給雜訊副頻帶功率估計 計算器NP100作為該組雜訊副頻帶信號。 在另一替代例中,加強器EN200經組態以根據模式選擇 140748.doc -78- 201013640 信號S80之狀態在不同雜訊副頻帶功率估計組中進行選擇 以產生5玄組釗頻帶增益因數。圖50展示加強器ΕΝ3〇〇(及加 強器ΕΝ310)之此實施例ENUO的方塊圖,實施例ΕΝ32〇& 括雜訊副頻帶功率估計計算器ΝΡ1〇〇之第一例子Npi〇〇a、 雜訊副頻帶功率估計計算器NP100之第二例子Npi〇〇b及選 擇器SL30。第一雜訊副頻帶功率估計計算器Npi〇〇a經組 態以產生第一組雜訊副頻帶功率估計,其係基於由如上文 ❹ Ο 所述之第一雜訊副頻帶信號產生器NGl〇〇a產出之該組副 頻帶信號。第二雜訊副頻帶功率估計計算器Npi〇〇b經組態 以產生第二組雜訊副頻帶功率估計,其係基於由如上文所 描述之第二雜訊副頻帶信號產生器NGl〇〇b產出之該組副 頻帶信號。舉例而言,加強器刪2〇可經組態以並行地評 估雜訊參考中之每一者的副頻帶功率估計。選擇器 SL3〇(例如,解多工器)經組態以根據模式選擇信號讓之 當前狀態來在由第-雜關頻帶功率估計計算請】術及 第二雜訊副頻帶功率估計計算請祕產生之多組雜訊副 頻帶功率估計中選擇-者且將該敎組之雜訊副頻帶功率 估計提供給增益因數計算器FC300。 第-雜訊副頻帶功率估計計算器Νρι_可實施為副頻帶 =估計計算器職〇之例子或實施為副頻帶功率估計計 异盗EC12G之例子。第二雜訊副頻帶功率估計計 刪_亦可實施為副頻帶功率估計計算器ecug之例 實施為副頻帶功率估計計算器Ecm之例子。第二雜訊副 頻帶功率估計計算器Np i 〇 1001)亦可經進一步組態以識別未經 140748.doc -79- 201013640 分離之雜訊參考S95之當前副頻帶功率估計的最小值且用 此最小值來替換未經分離之雜訊參考S95的其他當前副頻 帶功率估计。舉例而s,第二雜訊副頻帶功率估計計算器 NPlOOb可實施為如圖51A所示之副頻帶信號產生器EC21〇 的例子。副頻帶信號產生器EC210為如上文所述之副頻帶 信號產生器EC110之一實施例,其包括一最小化器河以^, 最小化器MZ10經組態以根據諸如下式之表達式來識別及 應用最小副頻帶功率估計: E(i,k)<-minlsiSqE(i,k) (21) 其中。或者,第二雜訊副頻帶功率估計計算器 NPlOOb可實施為如圖51B所示之副頻帶信號產生器EC22〇 的例子。副頻帶信號產生器EC220為如上文所描述之副頻 帶k號產生器EC120之一實施例,其包括最小化器Mzl〇i 例子0 可希望組態加強器EN32〇以在多頻道模式下操作時計算 5iJ頻帶增益因數值,副頻帶增益因數值係基於來自未經分 離之雜訊參考S95的副頻帶功率估計以及基於來自雜訊參 考S30之副頻帶功率估計。圖52展示加強器EN32〇之此實 施例EN330的方塊圖。加強器eN33〇包括經組態以根據諸 如下式之表達式來計算一組副頻帶功率估計的最大化器 MAX10 : (22) E(i,k) — max(Eb (i,k), E。(i, k)) 140748.doc 201013640 八中’其中五6(/,是)表示副頻帶/及訊框a:的由第一雜訊 副頻帶功率估計計算器Npl00a計算之副頻帶功率估計且 五c α幻表示副頻帶z•及訊框免的由第二雜訊副頻帶功率估計 計算器NPl〇〇b計算之副頻帶功率估計。 可希望裝置A1 00之實施例在組合來自單頻道及多頻道雜 訊參考之雜訊副頻帶功率資訊的模式下操作。雖然多頻道 ••雜訊參考可支援對非穩定雜訊之動態響應,但該裝置之合 成操作可對(例如)使用者位置之改變反應過度。一單頻道 © #訊參考可提供更敎但缺乏補償非穩㈣訊之能力的響 應。圖53展示加強器EN11〇i實施例ΕΝ4〇(^方塊圖,實 施例ΕΝ400經組態以基於來自雜訊參考S3〇之資訊及基於 來自未經分離之雜訊參考S95的資訊來加強語音信號s4〇之 頻譜對比。加強器EN彻包括如上文所揭示般组態的最大 化器MAX 1 〇之例子。 亦可實施最大化器MAX1(m允許對單頻道及多頻道雜訊 _ ㈣帶功率估計之增益的獨立操縱。舉例而言,可希望實 施最大化HMAX1G以應用—增益因數(或—組增益因數中 之相應者)來對由第—副頻帶功率估計計算器NPlOOa及/或 第田J頻帶功率估叶計异器Np j _產出之雜訊副頻帶功率 十中之或多者(可能所有)中之每一者進行按比例調 整,使得該按比例調整發生於最大化操作上游。 在包括裝置A100之一實施例的器件之操作期間的一些時 間時,可希望該裝置根據來自一不同於雜訊參考S30之參 考的資訊來加強語音信號S40之頻譜對比。對於所要聲音 140748.doc 201013640 量(例如,使用者之話音)及方向性雜訊分量(例如,來自 干擾揚聲态、公共廣播系統、電視或收音機)自相同方向 達麥克風陣列之情景,例如,一方向性處理操作可提^ 對此等77量之不充分分離。在此種情況下,該方向性處理 ' 了將方向性雜訊分量分離至源信號S20中,使得所得 雜訊參考S30可不足以支援語音信號之所要加強。 寸 可希望實施裝置八100以應用如本文所揭示之方向性處理 操作及距離處理操作兩者的結果。舉例而言,對於近場所 要聲音分量(例如,使用者之話音)及遠場方向性雜訊分量 (例如,來自干擾揚聲器、公共廣播系統、電視或收音機) 自相同方向到達麥克風陣列之情況,此實施例可提供改良 之頻譜對比加強效能。 在一實例中,裝置A100之包括SSP濾波器SS110之一例 子的一實施例經組態以在距離指示信號DU〇之當前狀態指 示遠場信號時繞過加強器EN10(例如,如上文所描述)^此 配置(例如)對於加強器EN10經組態以將源信號S20作為語 音信號來接收的裝置A110之一實施例而言可為所要的。 或者,可希望實施裝置A100以根據雜訊副頻帶功率估計 來相對於語音信號S40之另一副頻帶來提昇語音信號s4〇之 至少一副頻帶及/或使語音信號S40之至少一副頻帶衰減, 該等雜訊副頻帶功率估計係基於來自雜訊參考S 3 〇之資訊 及基於來自源信號S20之資訊。圖54展示加強器EN20之此 實施例EN450的方塊圖,實施例EN450經組態以將源信號 S20作為額外雜訊參考來處理。加強器EN450包括雜訊副 140748.doc -82· 201013640 頻帶k號產生器NG100之第三例子NGlOOc、副頻帶功率估 計計算器NP100之第三例子NP100c,及最大化器ΜΑχι〇ι 例子MAX2〇。第三雜訊副頻帶功率估計計算器NPlOOc經 配置以產生第三組雜訊副頻帶功率估計,其係基於由第三 雜訊副頻帶信號產生器NG100c自源信號S20產出之一組副 頻帶信號,且最大化器MAX20經配置以自第一及第三雜訊 副頻帶功率估計中選擇最大值。在此實施例中,選擇器 SL40經配置以接收由如本文所揭示之ssp濾波器ss丨丨〇的 實施例產出的距離指示信號DI10。選擇器Sl30經配置以在 距離指示信號DI10之當前狀態指示遠場信號時選擇最大化 器MAX20之輸出,且否則選擇第一雜訊副頻帶功率估計計 算器NPlOOa之輸出。 明確地揭示,亦可實施裝置Αίοο以包括如本文所揭示之 加強器EN200的一實施例的例子’其經組態以將源信號 S20作為第二雜訊參考而非未經分離之雜訊參考S95來接 收。亦明確地提到’加強器EN200之將源信號S20作為雜 訊參考來接收的實施例對於加強再生語音信號(例如,遠 ~ 號)比對於加強所感測語音信號(例如,近端信號)可為 更有用的。 圖55展示裝置A100之實施例A250的方塊圖,實施例 A250包括如本文所揭示之SSP濾波器SS110及加強器 EN450。圖56展示加強器EN450(及加強器EN400)之實施例 EN460的方塊圖,實施例EN460將對遠場非穩定雜訊之補 償的支援(例如,如本文中參考加強器EN450所揭示)與來 140748.doc •83- 201013640 自單頻道及多頻道雜m參考兩者之雜訊副頻帶功率資訊 (例如,如本文中參考加強器EN400所揭示)組合。在此實 例中,增益因數計算器FC3〇〇接收基於來自三個不同雜訊 估計之資訊的雜訊副頻帶功率估計:未經分離之雜訊參考 S95(其可經重平滑及/或長時間平滑,諸如多於五個訊 框)、來自源信號S20之遠場非穩定雜訊之估計(其可未經 平滑或僅最小限度地平滑),及可為基於方向的雜訊參考 S30»重申,加強器丑^^㈧的本文揭示為應用未經分離之 雜訊參考SM的任何實施例(例如,如圖%中所說明)亦可 經實施以改為應用來自源信號S2〇的一經平滑之雜訊估計 (例如,經大量平滑之估計及/或在若干個訊框内平滑的長 時間估計)。 可希望組態加強器EN200(或加強器eN4〇〇或加強器 EN450)以僅在未經分離之雜訊參考S95(或相應未經分離之 所感測音訊信號)為無作用的時間間隔期間更新基於未經 分離之雜訊參考S95的雜訊副頻帶功率估計。裝置Al〇〇之 此實施例可包括話音活動偵測器(VAD),話音活動偵測器 經組態以基於一或多個因數(諸如,訊框能量、信雜比、 週期、語音及/或殘差之自相關(例如’線性預測編碼殘 差)、過零率及/或第一反射係數)來將未經分離之雜訊參考 S95之訊框或未經分離之所感測音訊信號之訊框分類為有 作用(例如,語音)或無作用(例如,背景雜訊或寂靜)。此 分類可包括將此因數之值或量值與一臨限值進行比較及/ 或將此因數之改變的量值與臨限值進行比較。可希望實施 140748.doc 84· 201013640 此VAD以基於多個準則r你丨‘ At旦 。 +則(例如,忐量、過零率等等)及/或近 來VAD決策之記憶來執行話音活動偵測。 圖57展示裝置儀之包括此話音活動谓測器(或 —「VAD」)V20的此實施例A23〇。話音活動伯測器v2〇(其可 實施為如上文所描述之VAD vl〇之例子)經組態以產出狀 態指示針對所感測音訊頻道s! 〇 是否偵測到語音活動的 更新控制信號ucio。對於裝置A230包括如圖48所示之加 強器EN200的實施例助〇〇的情況而言,可應用更新控制 瘳㈣UC10來防止雜訊副頻帶信號產生器而⑽在針對所感 測音訊頻道S10-1偵測到語音且選擇一單頻道模式的時間 間隔(例如,訊框)期間接受輸入及/或更新其輸出◊對於裝 置A230包括如圖48所示之加強器EN200的實施例EN300或 如圖49所示之加強器EN2〇〇的實施例EN310的情況而言, 可應用更新控制信號UC1 〇來防止雜訊副頻帶信號估計產 生器N P10 0在針對所感測音訊頻道S10 · 1偵測到語音且選擇 單頻道模式的時間間隔(例如,訊框)期間接受輸入及/或 更新其輸出。 對於裝置A230包括如圖49所示之加強器EN200的實施例 EN3 10的情況而言’可應用更新控制信號uC10來防止第二 雜訊副頻帶信號產生器NG100b在針對所感測音訊頻道S10-1偵測到語音的時間間隔(例如,訊框)期間接受輸入及/或更 新其輸出。對於裝置A230包括加強器EN200之實施例 EN320或加強器EN200之實施例EN330的情況而言,或對 於裝置A100包括加強器EN200之實施例EN400的情況而 140748.doc -85- 201013640 言’可應用更新控制信號uc 10以在針對所感測音訊頻道 s 10-1彳貞測到語音的時間間隔(例如,訊框)期間防止第二雜 訊副頻帶信號產生器NG100b接受輸入及/或更新其輸出及/ 或防止第二雜訊副頻帶功率估計產生器NPlOOb接受輸入及/ 或更新其輸出。 圖58A展示加強器EN4〇〇之此實施例en55的方塊圖。加 強器EN55包括雜訊副頻帶功率估計計算器Np1〇〇b之實施 例NP105,實施例NP105根據更新控制信號U(:1〇2狀態來 產出一組第二雜訊副頻帶功率估計。舉例而言,雜訊副頻 帶功率估計計算器NP105可實施為圖58B之方塊圖中所示 的功率估計計算器EC120之實施例£(:125的例子。功率估 計計算器EC125包括平滑器EC20之實施例£(:25,實施例 EC25經組態以根據諸如下式之線性平滑表達式來對由求和 器EC10計算的4個總和中之每一者執行時間平滑操作(例 如’兩個或兩個以上無作用訊框上之平均值 E(i,k) k - +(1 _ Y)E(i,k),UC1。指示有作用訊框 L E(i,k-1), 其他 ’ (18) 其中γ為平滑因數。在此實例中,平滑因數γ具有在零㈠ 平滑)至一(最大平滑,不更新)之_中的值(例如,〇3、 〇.5、〇.7、0.9、0.99或0.999)。可希望平滑器%25針對冷 有該q個副頻帶使用平滑因數丫之相同值。或者,可希 滑器EC25針對該_副頻帶中之兩者或兩者以上(可^ 有)中之每一者使用平滑因數γ之不同值。平滑因數 140748.doc -86 - 201013640 (或多個值)可為固定的或可隨著時間過去而加以調適(例 如,自一個訊框至下一個訊框)。類似地,可希望使用雜 訊副頻帶功率估計計算器NP1 05之一例子來在加強器 EN320(如圖50所示)、EN330(如圖52所示)、EN450(如圖54 所示)或EN460(如圖56所示)中實施第二雜訊副頻帶功率估 計計算器NPlOOb。 - 圖59展示裝置A100之替代實施例A300的方塊圖,實施 例A3 00可經組態以根據一模式選擇信號之當前狀態來在單 ® 頻道模式或多頻道模式下操作。類似裝置A200,裝置 A100之裝置A300包括經組態以產生一模式選擇信號S80的 一分離評估器(例如,分離評估器EV10)。在此種情況下, 裝置入300亦包括經組態以對語音信號840執行八0(:或八¥€ 操作的一自動音量控制(AVC)模組VC10,且應用模式選擇 信號S80以控制選擇器SL40(例如,多工器)及SL50(例如, 解多工器)來根據模式選擇信號S80之相應狀態針對每一訊 框在AVC模組VC10及加強器EN10中選擇一者。圖60展示 W 裝置A300之實施例A310的方塊圖,實施例A310亦包括如 . 本文所描述的加強器EN150之實施例EN500及AGC模組G10 及VAD V10之例子。在此實例中,加強器EN500亦為如上 • 文所描述之加強器EN160之實施例,其包括經配置以限制 等化器之聲輸出位準的峰值限制器L10的例子。(一般熟習 此項技術者將理解,亦可使用如本文所揭示之加強器 EN10之替代實施例(諸如,加強器EN400或EN450)來實施 裝置A300之此組態及其他所揭示之組態。) 140748.doc -87- 201013640 A G C或AV C操作基於穩疋雜訊估計來控制音訊作號之 位準’該穩定雜訊估計通常係自單一麥克風獲得。可自如 本文所描述的未經分離之雜訊參考S95之例子(或者,自所 感測音訊信號S1 〇)來計算此估計。舉例而言,可希望組雖 AVC模組VC10以根據一參數(諸如,未經分離之雜訊參考 S95之功率估計)之值(例如,當前訊框之能量或絕對值之 總和)來控制語音信號S40的位準。如上文參考其他功率估 計所描述的,可希望組態AVC模組vcl〇以僅在未經分離之 所感測音訊信號當前不含有話音活動時對此參數值執行時⑩ 間平滑操作及/或更新參數值。圖61展示裝置Α3ι〇之實施 例A320的方塊圖,其中AVC模組vcl〇之實施例vc2〇經組 態以根據來自所感測音訊頻道SiOd之資訊(例如,信號 sio-i之當前功率估計)來控制語音信號S4〇之音量。 圖62展示裝置A1〇〇之另一實施例A4〇〇的方塊圖裝置 A400包括如本文所描述之加強器EN2〇〇的實施例且類似於 裝置A20G。然而,在此種情況下,藉由非相關雜訊摘測器 UD10來產生模式選擇信號S8〇。非相關雜訊(其為影響—❿ 陣列中之一麥克風且不影響另一麥克風的雜訊)可包括風 雜訊彳吸聲、劈拍雜訊及其類似者。非相關雜訊可在諸 如SSP遽波器SS10之多麥克風信號分離系統中造成非所要: 心果因為該系統在准許時實際上可放大此雜訊。用於读 測非相關雜訊之技術包括估計麥克風信號(或其部分,諸 如每麥克風信號中自約200 Hz至約800 Hz或1〇〇〇出之 頻帶)的父又相關。此交又相關估計可包括對次要麥克風 140748.doc • 88 · 201013640 信號之通頻帶進行增益調整以等化麥克風之間的遠場響 應、自主要麥克風信號之通頻帶刪減經增益調整之信號, 及將差信號之能量與一臨限值(其可基於差信號及/或主要 麥克風通頻帶之能量隨著時間過去而為適應性的)進行比 較。可根據此技術及/或任何其他合適技術來實施非相關 雜訊偵測器UD10。在多麥克風器件中非相關雜訊之偵測 亦論述於2008年8月29曰申請之題為 「SYSTEMS, METHODS, AND APPARATUS FOR DETECTION OF β UNCORRELATED COMPONENT」的美國專利申請案第 12/201,528號中,該文件以引用之方式藉此併入本文中, 目的限於揭示非相關雜訊偵測器UD10之設計及實施及此 偵測器至語音處理裝置中的整合。明確地提到,裝置A400 可實施為裝置A110之一實施例(亦即,使得加強器EN200 經配置以將源信號S20作為語音信號S40來接收)。 在另一實例中,裝置A100之包括非相關雜訊偵測器 UD10之例子的實施例經組態以在模式選擇信號S8〇具有第 二狀態時(亦即,在模式選擇信號S80指示偵測到非相關雜 訊時)繞過加強器EN10(例如,如上文所描述)。此配置(例 如)對於加強器EN10經組態以將源信號S20作為語音信號來 接收的裝置A110之一實施例而言可為所要的。 如上文所提到,可希望藉由對兩個或兩個以上麥克風伴 ' 號執行一或多個預處理操作來獲得所感測音訊信號81〇。 圖63展示裝置A100之實施例A500(可能裝置au〇及/或 Α120的實施例)的方塊圖,實施例Α500包括經組態以預處 140748.doc -89- 201013640 理Μ個類比麥克風信號SM1〇1至smi〇 m以產出所感測音 訊信號si〇iM個頻道81〇1至81〇 ]^的音訊預處理器 AP10。舉例而言,音訊預處理器Αρι〇可經組態以數位化 一對類比麥克風信號SM1〇-l、SM10-2以產出所感測音訊 信號sio之一對頻道S1(M、sl〇 2。明確地提到,裝置 A500可實施為農置AU〇之一實施例(亦即,使得加強器 EN10經配置以將源信號S2〇作為語音信號S4〇來接收)。 音筑預處理器Αρι〇亦可經組態以在類比及/或數位域中 對麥克風信號執行其他預處理操作,諸如頻譜整形及/或 回音消除。舉例而言,音訊預處理器入卩…可經組態以在類 比域及數位域中之任一者中將一或多個增益因數應用於麥 克風信號中之一或多者中的每一者。可選擇或以其他方式 來計算此等增益因數之值,使得在頻率響應及/或增益方 面使麥克風彼此匹配。在下文更詳細地描述可經執行以評 估此等增益的校正程序。 圖64A展示音訊預處理器八卩10之實施例AP20的方塊圖, 實施例AP20包括第一類比數位轉換器(ADC)C 10a及第二類 比數位轉換器(ADC)Cl〇t^第一 Adc C10a經組態以數位化 來自麥克風MC10之信號SM10-1以獲得經數位化之麥克風 信號〇]^10-1,且第二八〇(:(:1015經組態以數位化來自麥克 風MC20之信號SM10-2以獲得經數位化之麥克風信號 DM10-2。可由ADC Cl〇a及ADC C10b應用之典型取樣速率 包括8 kHz、12 kHz、16 kHz及在約8 kHz至約16 kHz之範 圍中的其他頻率,但亦可使用高如約44 kHz之取樣速率。 140748.doc -90- 201013640 在此實例中’音訊預處理器AP20亦包括:一對類比預處理 器P10a及P1 〇b,其經組態以在取樣之前分別對麥克風信號 SM10-1及SM10-2執行一或多個類比預處理操作;及—對 數位預處理器P20a及P20b,其經組態以在取樣之後分別對 麥克風信號DM10-1及DM10-2執行一或多個數位預處理操 作(例如’回音消除、雜訊減少及/或頻譜整形)。 ' 圖65展示裝置A31〇之實施例A330的方塊圖,實施例 A330包括音訊預處理器AP2〇之例子。裝置A33〇亦包括 ^ AVC模組VC10之實施例VC3〇,實施例VC30經組態以根據 來自麥克風信號SM10-1之資訊(例如,信號SMioq之當前 功率估計)來控制語音信號S40的音量。 圖64B展示音訊預處理器AP20之實施例aP3〇的方塊圖。 在此實例中’類比預處理器P10a及P10b中之每一者實施為 高通濾波器F10a及F10b中之各別者,高通濾波器”如及 F10b經組態以在取樣之前分別對麥克風信號1 1及 φ SM10-2執行類比頻譜整形操作。每一濾波器F1〇a&Fi〇b 可經組態以在(例如)5〇 Hz、100 Hz或200 Hz之截止頻率下 執行高通濾波操作。 對於語音信號S40為再生語音信號(例如,遠端信號)之 . 情況而言,可使用相應經處理語音信號S50來訓練經組態 以自所感測音訊信號S10消除回音(亦即,自麥克風信號移 除回音)的一回音消除器。在音訊預處理器AP30之實例 中,數位預處理器P20a及P2〇b實施為經組態以基於來自經 處理語音信號S50之資訊來自所感測音訊信號S10消除回音 14Q748.doc •91 - 201013640 的回音消除器EC1G。回音消除器EC1()可經配置以自時域 緩衝器接收經處理語音信號S 5 〇。在一個此種實例中,時 域緩衝器具有十毫秒之長度(例如,在8 kHz之取樣速率下 的八十個樣本或在16 kHz之取樣速率下的16〇個樣本)。在 包括裝置Al10之通信器件的某些操作模式(諸如,揚聲器 電話模式及/或即按即說(PTT)模式)期間,可希望延緩回音 消除操作(例如,組態回音消除器EC1〇以使麥克風信號未 改變地通過)。 使用經處理語音信號S50來訓練回音消除器有可能可引 起反饋問題(例如,歸因於在回音消除器與加強控制元件 之輪出之間出現的處理之程度)。在此種情況下,可希望 根據加強器EN10之當前活動來控制回音消除器之訓練速 率。舉例而言,可希望與增益因數之當前值的量測(例 如,平均值)成反比例地控制回音消除器之訓練速率及/或 與增益因數之連續值之間的差異之量測(例如,平均值)成 反比例地控制回音消除器之訓練速率。 圖66A展示回音消除器EC10之實施例£(:12的方塊圖實 施例EC12包括單頻道回音消除器之兩個例子EC2〇a及 EC20b。在此實例中,單頻道回音消除器之每一例子經組 態以處理麥克風信、DM1〇_2中之相應者以產出 所感測音訊信號S10之相應頻道S10_i、s10_2。可各自根 據當前已知或仍待開發之任何回音消除技術(例如,最小 均方技術及/或適應性相關技術)來組態單頻道回音消除器 之各種例子。舉例而言,回音消除論述於上文提及之美國 140748.doc -92· 201013640 專利申請案第12/197,924號之段落[00139]-[00141]處(開始 於「An apparatus」且結束於「B5〇〇」),該等段落以引用 之方式藉此併入本文中,目的限於揭示回音消除問題,包 括(但不限於)回音消除器之設計及/或實施及/或回音消除 器與語音處理裝置之其他元件的整合。 圖668展示回音消除器EC20a之實施例EC22a的方塊圖, 實施例EC22a包括經配置以對經處理語音信號S5〇進行濾波 的一濾波器C E10及經配置以將經濾波信號與正處理之麥克 風信號組合的一加法器CE2〇。濾波器CE1〇之濾波器係數 值可為固定的。或者,在裝置A11〇之操作期間可調適濾波 器CE10之濾波器係數值中之至少一者(及可能所有)(例 如’基於經處理語音信號S50)。如下文更詳細地描述,可 希望使用一組多頻道信號將濾波器CE1〇之參考例子訓練為 至初始狀態及將該初始狀態複製至濾波器CE i 〇之產出例子 中,該組多頻道信號係由一通信器件之一參考例子在再生 一音訊信號時記錄的。 回音消除器EC20b可實施為回音消除器EC22ai另一例 子’其經組態以處理麥克風信號DM 1 〇-2以產出所感測音 訊頻道S40-2。或者,回音消除器£(:2〇&及£;(:2〇1)可實施為 單頻道回音消除器之相同例子(例如,回音消除器 EC22a),其經組態以在不同時間時處理各別麥克風信號中 之每一者。 裝置A110之包括回音消除器Ecl〇之例子的實施例亦可 經組態以包括VAD VI0之一例子,該例子經配置以對經處 140748.doc -93· 201013640 理語音信號S50執行話音活動偵測操作。在此種情況下, 裝置A11 〇可經組態以基於話音活動操作之結果來控制回音 消除器EC10之操作。舉例而言’可希望組態裝置A11〇以 在此話音活動偵測操作之結果指示當前訊框有作用時啟動 對回a /肖除器EC 1 0之訓練(例如,調適)、增加回音消除器 EC10之訓練速率,及/或增加回音消除器1〇中之一或多 個濾波器(例如,濾波器CE10)的深度。 圖66C展示裝置A110之實施例A600的方塊圖。裝置A6〇〇 包括一等化器EQ10,等化器EQ1{^f配置以處理音訊輸入 信號S100(例如,遠端信號)以產出經等化之音訊信號 ES10。等化器EQ10可經組態以基於來自雜訊參考S3〇之資 訊動態地更改音訊輸入信號S100之頻譜特性以產出經等化 之音訊信號ES10。舉例而言,等化器Eq1〇可經組態以使 用來自雜訊參考S30之資訊相對於音訊輸入信號sl〇〇之至 少一其他頻率副頻帶來提昇音訊輸入信號S1 〇〇之至少一頻 率副頻帶以產出經等化之音訊信號ES 10。等化器EQ1 〇之 實例及相關等化方法揭示於(例如)上文所提及之美國專利 申請案第12/2 77,283说中。可實施如本文所揭示之通信器 件D100以包括裝置A600而非裝置A550之一例子。 可經構造以包括裝置A1 00之實施例(例如,裝置A110之 實施例)的音訊感測器件之一些實例說明於圖67A至圖72C 中。圖67A展示第一操作組態中之雙麥克風手機^1100的沿 著中心軸的橫截面圖。手機H100包括一具有主要麥克風 MC10及次要麥克風MC20的陣列。在此實例中,手機H1 〇〇 140748.doc •94· 201013640 亦包括一主要揚聲器SP10及一次要揚聲器SP20。在手機 H100處於第一操作組態中時,主要揚聲器SP10為有作用 的且次要揚聲器SP20可停用或否則靜音。可希望主要麥克 風MCI0及次要麥克風MC20在此組態下均保持有作用的以 支援用於語音加強及/或雜訊減少之空間選擇性處理技 術。 手機H100可經組態以經由一或多個編解碼器用無線方式 來傳輸及接收話音通信資料。可與或經調適以與如本文所 ❹ 描述之通信器件的傳輸器及/或接收器一起使用的編解碼 器之實例包括:加強型可變速率編解碼器(EVRC),如描 述於 2007 年 2 月之題為「Enhanced Variable Rate Codec, Speech Service Options 3,68, and 70 for Wideband Spread Spectrum Digital Systems」的第三代合作夥伴計劃2(3GPP2) 文件C.S0014-C,vl.O中(在评\^^-(!〇卜3§卩卩-(1〇卜〇犷§處線上可 獲得);可選擇模式聲碼器語音編解碼器,如描述於2004 年 1 月之題為「Selectable Mode Vocoder (SMV) Service Option for Wideband Spread Spectrum Communication Systems」的 3GPP2 文件 C.S0030-0, v3.0 中(在 www-dot-3gpp-dot-org處 線上可獲得);適應性多速率(AMR)語音編解碼器,如描述 於文件ETSI TS 126 092 V6.0.0(歐洲電信標準協會 (ETSI),索菲亞-安提波利斯高等商學院,法國,2004年12 月)中;及AMR寬頻帶語音編解碼器,如描述於文件ETSI TS 126 192 V6.0.0(ETSI,2004年 12月)中。 圖67B展示手機H100之第二操作組態。在此組態中,主 140748.doc -95- 201013640 要麥克風MC10為閉塞的,次要揚聲器Sp2〇為有作用的, 且主要揚聲器SP10可停用或否則靜音。再次,可希望主要 麥克風MC10及次要麥克風MC20兩者在此組態下保持有作 用(例如,以支援空間選擇性處理技術)。手機H1〇〇可包括 一或多個開關或類似致動器,其狀態(或多個狀態)指示器 件之當前操作組態。 裝置A100可經組態以接收所感測音訊信號sl〇之具有兩 個以上頻道的例子。舉例而言,圖68A展示手機H1〇〇之實 施例H110的橫截面圖,其中陣列包括第三麥克風mc3()。 圖68B展示手機H110之兩個其他視圖,其展示各種轉換器 沿著該器件之軸的放置。圖67A至圖68B展示掀蓋型 (clamshelMype)蜂巢式電話手機的實例。具有裝置A100之 實施例的蜂巢式電話手機之其他組態包括直立型及滑蓋型 電話手機,以及轉換器中之一或多者安置成遠離該轴的手 機。 具有Μ個麥克風之耳承或其他頭戴式耳機為可包括裝置 Α100之實施例的另一類攜帶型通信器件。此頭戴式耳機可 為有線或無線的。圖69Α至圖69D展示此無線頭戴式耳機 D300之一實例的各種視圖,頭戴式耳機m〇〇包括一載有 雙麥克風陣列之外殼Z1〇及一自該外殼延伸的用於再生遠 端信號的聽筒Z20(例如,揚聲器) 此器件可經組態以經 由與諸如蜂巢式電話手機之電話器件的诵 J通15 (例如,使用 由藍芽技術聯盟公司(華盛頓州貝爾維尤、路 叫作尤)發布之Blueto〇th™ 協定之版本)來支援半雙工或全雙工電話。 六"體上’如圖 140748.doc •96· 201013640 69A、圖69B及圖69D所示,一頭戴式耳機之外殼可為矩形 或否則為狹長的(例如,形如酷行通耳機(minib〇〇m))或可 為更圓的或甚至圓形。該外殼可封入一電池及一處理器及/ 或經組態以執行裝置A100之實施例的其他處理電路(例 如,印刷電路板及其上安裝之組件)。該外殼亦可包括一 電力埠(例如’迷你通用串列匯流排(USB)或用於電池充電 之其他琿)及諸如一或多個按鈕開關及/或LED的使用者介 面特徵。通常,該外殼之沿著其主軸之長度係在一英吋至 ’三英吋之範圍中。 通常,該陣列中之每一麥克風安裝於該器件内該外殼中 之充田聲埠的一或多個小孔後面。圖69B至69〇展示該陣 列之主要麥克風的聲埠Z4〇及該陣列之次要麥克風的聲埠 Z50的位置。一頭戴式耳機亦可包括一緊固器件(諸如,耳 鉤Z3 0),其通常可自該頭戴式耳機拆却。舉例而言,一外 邓耳鉤可為可顛倒的以允許使用者組態該頭戴式耳機以在 ❿任一耳朵上使用。或者,一頭戴式耳機之聽筒可設計成一 内部緊固器件(例如,耳塞),其可包括一可移除耳承以允 許不同使用者使用不同大小(例如,直徑)之耳承以更好地 適合於特定使用者之耳道的外部。 圖70A展示如經安裝以用在使用者之耳朵^上的頭戴式 耳機D300之實施例D31〇的不同操作組態之範圍“的圖。 頭戴式耳機D310包括配置成端射式組態的主要麥克風及次 要麥克風之陣列67,其在使用期間可相對於使用者之嘴巴 64不同地m另—實例中,—包括裝置a⑽之實施例 140748.doc -97- 201013640 的手機經組態以自具有Μ個麥克風之頭戴式耳機接收所感 測音訊信號S10,及經由有線及/或無線通信鏈路(例如,使 用Bluetooth™協定之版本)來將遠端經處理語音信號sw輪 出至頭戴式耳機。 ^ 圖71A至圖71D展示為無線頭戴式耳機之另—實例的多 麥克風攜帶型音訊感測器件D350的各種視圖。頭戴式耳機 D350包括一圓化之橢圓外殼Z12及一可組態為耳塞之聽筒 Z22。圖71A至圖71D亦展示器件D350之陣列的主要麥克風 之聲埠Z42及次要麥克風之聲埠Z52的位置。次要麥克風蜂 Z52有可能可為至少部分閉塞(例如,藉由使用者介面按 紐)〇 具有Μ個麥克風之免持車載裝置為可包括裝置A1〇〇之實 施例的另一類行動通信器件。此器件之聲環境可包括風雜 訊、滾動雜訊及/或引擎雜訊。此器件可經組態以安裝於 車輛之儀錶板中或可移除式地固定至擋風玻璃、遮陽板或 另一内表面。圖70B展示包括揚聲器85及Μ麥克風陣列84 的此車載裝置83的一實例之圖。在此特定實例中,Μ等於 四,且Μ個麥克風配置成線性陣列。此器件可經組態以經 由一或多個編解碼器(諸如,上文所列出之實例)用無線方 式來傳輸及接收話音通信資料。另外或其他,此器件可經 組態以經由與諸如蜂巢式電話手機之電話器件的通信(例 如,使用如上文所描述之Bluetooth™協定之版本)來支援 半雙工或全雙工電話。 可包括裝置A100之實施例的通信器件之其他實例包括用 140748.doc •98· 201013640 於音訊或視聽會議之通信器件。此會議器件之典型使用可 涉及多個所要語音源(例如,各個參與者之嘴巴)。在此種 情況下,可希望麥克風陣列包括兩個以上麥克風。 一具有Μ個麥克風之媒體播放器件為可包括裝置A100之 實施例的一類音訊或視聽播放器件。圖72Α展示此器件 ' D400之圖,其可經組態以用於播放(及可能用於記錄)壓縮 ·' 音訊或視聽資訊,諸如根據標準編解碼器(例如,動晝專 家組(MPEG)-l 音訊層 3(MP3)、MPEG-4部分 14(ΜΡ4)、視 β 窗媒體音訊/視訊(WMA/WMV)之版本(微軟公司,華盛頓 州雷蒙德)、進階音訊編碼(AAC)、國際電信聯盟(ITU)-T H.264,或其類似者)編碼之檔案或流。器件D400包括安置 在器件之正面處的一顯示螢幕DSC10及一揚聲器SP10,且 麥克風陣列之麥克風MCI 0及MC20安置於器件之相同面處 (例如,如在此實例中安裝於頂面之相對側上,或安裝於 正面之相對側上)。圖72B展示器件D400之另一實施例 D410,其中麥克風MC10及MC20安置於器件之相對面處, 且圖72C展示器件D400之另一實施例D420,其中麥克風 . MC10及MC20安置於器件之相鄰面處。圖72A至圖72C中所 ' 示之媒體播放器件亦可經設計,使得較長之軸在期望使用 ' 期間為水平的。 裝置A100之一實施例可包括於收發器(例如,如上文所 描述之蜂巢式電話或無線頭戴式耳機)内。圖73A展示此通 信器件D100之方塊圖,通信器件D100包括裝置A500及裝 置A120之實施例A550。器件D100包括一耦接至裝置A550 140748.doc -99- 201013640 的接收器R10,接收器請經組態以接收射頻(rf)通信信號 且解碼及再生在RF信號内經編瑪之音訊信號作為遠端音訊 輸入信號議,信號議在此實例中由裝置A·作為語 音信號㈣來接收。器件D1〇〇亦包括一輕接至裝置MM的 傳輸器XH) ’傳輸器Xl0經組態以對近端經處理語音信號 S50b進行編瑪且傳輸描述經編碼音訊信號之rf通信信號。 裝置A550之近端路徑(亦即,自信號SMi〇^smi〇_2至經 處理語音信號S50b)可被稱作器件Dl〇〇之「音訊前端」。器 件DU)0亦包括-音訊輸出級⑽,音訊輸出級〇ι〇經組態參 以處理遠端經處理語音信號S5〇a(例如,將經處理音信號 S50a轉換成類比信號)且將經處理音訊信號輸出至揚聲器 SP10在此實例中,音訊輸出級〇1〇經組態以根據音量控 制信號VS10之位準來控制經處理音訊信號之音量,此位準 可在使用者控制下改變。 可希望裝置A100之實施例(例如,八11〇或八12〇)駐留於 -通信器件内,使得該器件之其他元件(例如,行動台數 據機(MSM)晶片或晶片組之基頻部分)經配置以對所感測❹ 音訊信號S10執行其他音訊處理操作。在設計將包括於裝 置A110之實施例中的回音消除器(例如,回音消除器奶❹) 期間’可希望考慮此回音消除器與通信器件之任何其他目; s消除益(例如,MSM晶片或晶片組之回音消除模組)之間 的可能協同效應。 圖73B展示通信器件Dl〇〇之實施例D200的方塊圖。器件 D200包括一包括經組態以執行裝置A55〇之一例子的一或 140748.doc 201013640 多個處理器的晶片或晶片組CS10(例如,MSM晶片組)。晶 片或晶片組CS10亦包括接收器R10及傳輸器xl〇之元件, 且CS10之該一或多個處理器可經組態以執行此等元件中之 一或多者(例如,經組態以對用無線方式接收到之經編碼 k號進行解碼以產出音訊輸入信號si 00且對經處理語音信 號S50b進行編碼的聲碼器vcl〇)。器件D2〇〇經組態以經由 天線C30來接收及傳輸尺!;通信信號。器件D2〇〇在至天線 C30之路徑中亦可包括一雙工器及一或多個功率放大器。 晶片/晶片組CS10亦經組態以經由小鍵盤C10來接收使用者 輸入且經由顯示器C20來顯示資訊。在此實例中,器件 D200亦包括一或多個天線C4〇以支援全球定位系統(Gps) 位置服務及/或與諸如無線(例如,Bluet〇〇thTM)頭戴式耳機 之外邛器件的短程通信。在另一實例中,此通信器件本身 為藍芽頭戴式耳機且缺少小鍵盤cl〇、顯示器C2〇及天線 C30 〇 圖74八展示聲碼器vcl〇的方塊圖。聲碼器vci〇包括一 編碼器ENC100,編碼器ENCl〇〇經組態以對經處理語音信 號S50進行編碼(例如,根據一或多個編解碼器,諸如本文 所識另〗之編解碼器)以產出相應近端經編碼語音信號E1 〇。 聲碼器vcio亦包括一解碼器DEC1〇〇,解碼器DECi〇〇經組 態以對遠端經編碼語音信號E2〇進行解碼(例如,根據一或 多個編解碼器,諸如本文所識別之編解碼器)以產出音訊 輸入L號S 100。聲碼器vc丨〇亦可包括經組態以將信號E丄〇 之經編碼訊框組合成外出封包的一封包化器(未圖示)及經 140748.doc 201013640 組態以自傳人封包操取信號E2G之經編碼訊框的—解封包 化器(未圖示)。 -編解碼器可使用不同編碼方案來對不同類型之訊框進 行編碼。圖74B展示編碼器ENC1〇〇之實施例encu〇的方 塊圈,實施例ENC110包括_有作用訊框編碼器跳職 一無作用訊框編瑪器EN㈣。有作用訊框編碼器ENC10可 經組態以根據有聲訊框之編碼方案(諸如,碼激勵線性預 測(CELP)、原型波形内插(pwi)或原型音高週期(ppp)編碼 方案)來對訊框進行編碼。無作用訊框編碼器enc2〇可經 組態以根據無聲訊框之編碼方案(諸&,雜訊激勵線性預 測(NELP)編媽方案)或非有聲訊框之編❹案(諸如,修改 型離散餘弦變換(MDCT)編碼方案)來對訊框進行編碼。訊 框編碼器enc1〇&ENC20可共用共同結構,諸如Lpc係數 值之計算器(可能經組態以產出對於不同編碼方案具有不 同階的結果,諸如語音及非語音訊框之階比無作用訊框之 階高)及/或LPC殘差產生器。編碼器ENCn〇接收一編碼方 案選擇信號csio,編碼方案選擇信號CS10針對每一訊框 選擇訊框編碼器中之適當者(例如,經由選擇器seli及 SEL2)。解碼器DEC丨〇〇可經類似地組態以根據如由經編碼 語音信號E20内之資訊及/或相應傳aRF信號内之其他資訊 指示的此等編碼方案中之兩者或兩者以上中之一者來對經 編碼訊框進行解碼。 可希望編碼方案選擇信號C S 1 〇基於話音活動偵測操作之 結果,諸如本文所描述之(例如,裝置A16〇之)VAD vl〇或 140748.doc •102· 201013640 (例如,裝置A165之)V15之輸出。亦請注意,編碼器 ENC 110之軟體或韌體實施例可使用編碼方案選擇信號 CS10來將執行流引導至訊框編碼器中之一者或另一者,且 此實施例可不包括選擇器SEL丨及/或選擇器SEL2的類似 者。 或者’可希望實施聲碼器VC10以包括加強器EN10之經 組態以在線性預測域中操作的例子。舉例而言,加強器 EN10之此實施例可包括加強向量產生器VG1〇〇之實施例, 參 其經組態以基於如上文所描述之語音信號S40之線性預測 分析的結果來產生加強向量Ενι〇,其中該分析係由聲碼 器之另一元件(例如’ LPC係數值之計算器)執行。在此種 情況下,如本文所描述之裝置八1〇〇的一實施例之其他元件 (例如,自音訊預處理器AP1〇至雜訊減少級NRl〇)可位於 聲碼器上游。 圖75A展示可用以獲得係數值之設計方法mi〇的流程 圖,該等係數值表徵SSP濾波㈣吸—或多個方向性處 理級。方法M1G包括-記錄—組多頻道訓練信號的任務 τ1〇、一訓練SSP濾波器SS10之結構以收斂的任務τ2〇,及 評估經訓練之濾波器之分離效能的任務T3Q。通常使用個 人電腦或工作站來在音訊感測器件外部執行任務—及 Τ30。方法ΜΗ)之任務中之—或多者可反覆,直至在任務 赠獲得可接受之結果。在下文中更詳細地論述方法 mo之各種任務,且此等任務之額外描述見於2峨年8月
25 a t ft A r SYSTEMS, METHODS, AND APPARATUS 140748.doc •103- 201013640 FOR SIGNAL SEPARATI0N」的美國專利申請案第 12/197,924號中,該文件以引用之方式藉此併入本文中, 目的限於設計、實施、訓練及/或評估ssp濾波器881〇之_ 或多個方向性處理級。 任務T10使用至少μ個麥克風之陣列以記錄一組M頻道訓 練信號,使得該Μ個頻道中之每一者基於該M個麥克風中 之相應者的輸出。訓練信號中之每—者係基於由此陣列回 應於至少一資訊源及至少一干擾源而產出之信號,使得每 —訓練信號包括語音分量及雜訊分量兩者。舉例而言可❹ 希望訓練信號中之每一者為有雜訊環境中語音之記錄。麥 克風信號通常經取樣、可經預處理(例如,為回音消除、 雜訊減少、頻譜整形等等而進行濾波)及可甚至經預分離 (例如’藉由如本文所描述之另一空間分離瀘波器或適應 性濾波器)。對於諸如語音之聲應用而言,典型取樣速率 之範圍為8 kHz至16 kHz。 在P個場景中之一者下記錄該組M頻道訓練信號中之每 :者’其中p可等於二’但通常為大於—之任何整數。p個❹ 場景中之每一者可包含一不同空間特徵(例 个丨。J予機 或頭戴式耳機定向)及/或一不同頻譜特徵(例如,對可具有 : 不同性質之聲音源的捕獲)。該組訓練信號包括各自係在 · 該P個場景中之不同者下記錄的至少P個訓練信號但此組 將通常包括每一場景之多個訓練信號。 有可能使用含有如本文所描述之裝置A100之其他元件的 相同音訊感測器件來執行任務丁10。然而,更通常; 140748.doc •104· 201013640 用音訊感測器件之參考例子(例如,手機或頭戴式耳機)來 執行任務T10。接著在產出期間將由方法Ml0產出的一組 所得收斂濾波器解複製至相同或類似音訊感測器件之其他 例子中(例如,載入至每一此種產出例子之快閃記憶體 中)。 可使用一消聲腔室來記錄該組Μ頻道訓練信號。圖75B 展示經組態以用於記錄訓練資料之消聲腔室的實例。在此 實例中,一頭部及軀幹模擬器(HATS ’如由Bruel & O Kjaer(丹麥奈如姆)製造)定位於干擾源(亦即,四個揚聲器) 之向内聚集陣列内。HATS頭部在聲學上類似於代表性之 人類頭部且在嘴巴中包括一揚聲器以用於再生語音信號。 該干擾源陣列可受驅動以產生如所示般包圍HATS的漫射 雜訊場。在一個此種實例中,揚聲器之陣列經組態以在75 至78 dB之聲壓位準下在HATS耳朵參考點或嘴巴參考點處 播放雜訊信號。在其他情況下,一或多個此種干擾源可受 驅動以產生一具有不同空間分布的雜訊場(例如,方向性 參 雜訊場)。 可使用之雜訊信號的類型包括白雜訊、粉紅雜訊、灰雜 訊及Hoth雜訊(例如,如描述於由電氣與電子工程師學會 (IEEE)(新澤西州皮斯卡塔韋)發布的題為「Draft Standard Methods for Measuring Transmission Performance of Analog and Digital Telephone Sets, Handsets and Headsets」的 IEEE 標準269-2001中)。可使用之雜訊信號的其他類型包括褐雜 訊、藍雜訊及紫雜訊。 140748.doc -105- 201013640 在一陣列之麥克風的製造期間變化可出現,使得甚至在 一批大1產出及表觀相同之麥克風中,靈敏性在麥克風之 間可顯著地變化。可在(例如)加或減三分貝之靈敏性容差 下製造用於攜帶型大量市場器件中的麥克風,使得一陣列 中兩個此種麥克風的靈敏性可相差多達六分貝。 此外,一旦麥克風已安裝至器件中或器件上,在該麥克 風之有效響應特.|±中可發生改變。麥克風通常安裝於—器 件外殼内一聲埠後面且可藉由壓力及/或藉由摩擦或黏著 來固定於適當位置中。許多因素可影響以此方式安裝之麥 克風的有效響應特性,諸如其中安裝有麥克風之空腔之共 振及/或其他聲特性、麥克風與安裝墊圈之間的壓力之量 及/或均一性、聲埠之大小及形狀,等等。 參 由方法M10產出之收敛滤波器解之空間分離特性(例如, 相應波束圖形之形狀及定向)很可能對在任務τι〇中用以獲 取訓練信號的麥克風之相關特性敏感。可希望在使用參考 器件來記錄該組訓練信號之前相對於彼此來至少校正該器 件之Μ個麥克風的增益。此校正可包括計算或選擇將:用 於該等麥克風中之-或多者的輸出的加權因數使得該等 麥克風之增益的所得比率在所要範圍内。 任務Τ20使用該組訓練信號來根據源分離演算法訓練 SSP滤波器SS1〇之結構(亦即,計算相應收敛滤波器解)。 可使用個人電腦或工作站來在參考器件内執行任務了20, 但通常係在音訊感測器件外部執行。可希望任務T20產出 -收敛遽波器結構’其經組態以對具有一方向性分量之多 140748.doc 201013640 ,道輸人l號(例如’所感測音訊信號㈣)進行渡波,使 得在所得輸出信號中,該方向性分量之能量集中至輸出頻 (中之者(例如,源信號S20)中。此輸出頻道可具有與 該多頻道輸入作铗之紅 # 汽 號之任一頻道相比為增加之信雜比 βΝΜ。 匕 術°°源刀離演算法」包括盲源分離(BSS)演算法,其 為僅基於源信號之混合來分離個㈣㈣㈣ ❷ -或多個資訊源及一或多個干擾源的信號)的方法。盲源 刀離廣算法可用以分離來自多個獨立源之混合信號。因為 ,等技術不需要關於每—信號之源的資訊,所以其被稱為 盲源刀離」方法。術語「盲」指代參考信號或相關信號 不可用的事實,且此等方法通常包括關於資訊及/或干擾 ^號中之或多者的統計的假^。舉例而言,在語音應用 中,通常假定相關語音信號具有超高斯分布(例如,高峰 態)。BSS演算法之類別亦包括多變量盲解卷積演算法。 BSS方法可包括獨立分量分析之一實施例獨立分量 分析(ICA)為用於分離大概彼此獨立之混合源信號(分量)的 技術。以其簡化形式,獨立分量分析將權重之「未混合」 矩陣應用於混合信號(例如,藉由將該矩陣與該等混合信 號相乘)以產出經分離之信號。可給該等權重指派初始 值’該等初始值接著經調整以最大化該等信號之聯合熵以 便最小化資訊冗餘。重複此權重調整及熵增加過程,直至 將信號之資訊冗餘減少至最小值°諸如IC Α之方法提供用 於將語音信號與雜訊源分離的相當準確及靈活之手段。獨 140748.doc -107- 201013640 立向篁分析(「IVA」)為源信號為向量源信號而非單一可 變源信號的相關BSS技術。 源分離演算法之類別亦包括BSS演算法之變型,諸如受 約束ICA及受約束IVA,其係根據其他先驗資訊(諸如,聲 源之一或多者中之每一者相對於(例如)麥克風陣列之軸的 已知方向)而受約束。可僅基於方向性資訊且不基於所觀 測到之信號來區別此等演算法與應用固定、非適應性解的 波束成形器。 如上文參看圖8A所論述,SSP濾波器SS10可包括一或多 個級(例如,固定濾波器級叩10、適應性濾波器級af1〇)。 此等級_之每一者可基於一相應適應性濾波器結構,其係 數值係由任務T20使用自源分離演算法導出之學習規則來 計算的。該濾波器結構可包括前饋及/或反饋係數且可為 有限脈衝響應(FIR)或無限脈衝響應(IIR)設計。此等滤波 器結構之實例描述於如上文併入之美國專利申請案第 12/197,924號中。 圖76A展示適應性濾波器結構FS10之雙頻道實例的方塊 圖’濾波器結構FS10包括兩個反饋濾波器C110及C120, 且圖76B展示濾波器結構FSi〇之實施例FS2〇的方塊圖,實 施例FS20亦包括兩個直接型濾波器D110及D120 *可實施 空間選擇性處理濾波器SS1 0以包括此結構,使得(例如)輪 入頻道II、12分別對應於所感測音訊頻道S10-1、S10-2, 且輸出頻道ΟΙ、02分別對應於源信號S20及雜訊參考 S30。由任務T20用以訓練此結構之學習規則可經設計以最 140748.doc -108- 201013640 大化濾波器之輸出頻道之間的資訊(例如,最大化由滤波 器之輸出頻道中之至少一者含有的資訊之量)。此標準亦 可重新陳述為最大化輸出頻道之統計獨立性,或最小化輸 出頻道間之相互資訊,或最大化輸出處之熵。可使用之不 同學習規則的特定實例包括最大資訊(亦被稱作infomax)、 最大可能性,及最大非高斯性(例如,最大峰態)。 : 此等適應性結構及基於ICA或IVA適應性反饋及前饋方 案的學習規則的其他實例描述於以下各者中:於2006年3 ❹ 月 9 日公開之題為「System and Method for Speech Processing using Independent Component Analysis under Stability Constraints」的美國公開專利申請案第2006/0053002 A1 號;於2006年3月1曰申請之題為「System and Method for Improved Signal Separation using a Blind Signal Source Process」的美國臨時申請案第60/777,920號;於2006年3 月 1 日申請之題為「System and Method for Generating a Separated Signal」的美國臨時申請案第60/777,900號;及 題為「Systems and Methods for Blind Source Signal Separation」的國際專利公開案WO 2007/100330 Al(Kim等 人)。適應性濾波器結構及可在任務T20中用以訓練此等濾 - 波器結構的學習規則的額外描述可見於如在上文以引用之 方式併入的美國專利申請案第12/197,924號中。舉例而 言,可使用兩個前饋濾波器來代替兩個反饋濾波器來實施 濾波器結構FS10及FS20中之每一者。 可在任務T20中用以訓練如圖76A所示之反饋結構FS10 140748.doc 201013640 的學習規則之一實例可表達如下 (A) (B) (C) (D)
其中i表示時問# + & 3I 像本索引’心(0表示濾波器Clio在時間i時 之係數值,/J r,、矣_、备丄 2认〉衣不據波器C120在時間ί時之係數值,符號 ®表示時域卷積運算,~表*在輸出值灿)及从)之計算 後mcuG之第_係數值的改變,且^表示在輸出值 )及之叶算後濾波器ci2〇之第k個係數值的改變。 可希望將啟動函數/實施為近似所要信號之累積密度函數 的非線|±有界函數。可肖於語音制之啟動信以的非線 陡有界函數之實例包括雙曲線切線函數、S形函數及符號 函數。 可用於對自線性麥克風陣列接收到之信號進行方向性處 理的技術之另一種類通常被稱作「波束成形γ波束成形 技術使用Φ麥克風之空間Α集產生㈣道之間的時間差來 加強自特定方向到達之信號的分量。更特定言之,报可能 麥克風中之一者將更直接地朝向所要源(例如,使用者之 嘴巴),而其他麥克風可產生相對衰減之來自此源的信 號。此等波束成形技術為操縱一波束朝向聲音源從而將空 值置於其他方向的用於空間濾波之方法。波束成形技術不 對聲音源做假定,但為達成對信號去回響或定位聲音源的 140748.doc -110- 201013640 目的,假定源與感測器之間的幾何形態或聲音信號本身為 已知的。可根據資料依賴或資料獨立波束成形器設計(例 如,超導向波束成形器、最小平方波束成形器或統計上最 佳之波束成形器設計)來計算SSP濾波器SS10之結構的濾波 器係數值。在資料獨立波束成形器設計之情況下,可希望 對波束圖形進行整形以覆蓋所要空間區域(例如,藉由調 譜雜訊相關矩陣)。 任務T30藉由評估在任務T20中產出之經訓練濾波器的分 離效能來評估該濾波器。舉例而言,任務Τ30可經組態以 評估該經訓練濾波器對一組評估信號之響應。此組評估信 號可與任務Τ20中所用之訓練組相同β或者,該組評估信 號可為不同於(但類似於)該訓練組之信號(例如,使用相同 麥克風陣列之至少部分及相同ρ個場景中之至少一些來記 錄)的一組Μ頻道信號❶此評估可自動地執行及/或藉由人 監督來執行。通常使用個人電腦或工作站來在音訊感測器 件外部執行任務Τ3 〇。 ❹ 任務Τ3 0可經組態以根據一或多個度量之值來評估據波 器響應。舉例而言,任務Τ3 〇可經組態以計算一或多個度 量中之每一者的值且將所計算出之值與各別臨限值進行比 較。可用以評估濾波器響應之度量的一實例為(Α)—評估 仏號之原始資訊分量(例如,在評估信號之記錄期間自 HATS之嘴巴揚聲器再生的語音信號)與⑺)濾波器對彼評估 ^號之響應的至少一頻道之間的相關性。此度量可指示收 敛遽波器結構如何良好地將資訊與干擾分離。在此種情況 140748.doc -111- 201013640 下,在資訊分量與濾波器響應之Μ個頻道中之一者大體上 相關且與其他頻道具有很少相關性時,指示分離。 可用以評估濾波器響應(例如,指示濾波器如何良好地 將資訊與干擾分離)的度量之其他實例包括諸如變異數、 同斯性之統計性質及/或諸如峰態之較高階統計矩。可用 於语音信號之度量的額外實例包括過零率及時間突發(亦 被稱作時間稀疏(time sparsity))。大體上,語音信號展現 比雜訊信號低之過零率及低之時間稀疏。可用以評估漁波 器響應之度量的另一實例為如由濾波器對彼評估信號之響 應所指示的在評估信號之記錄期間資訊或干擾源相對於麥 克風陣列之實際位置與一波束圖形(或空值波束圖形)一致 的程度。可希望任務T30中所用之度量包括或將限於用於 裝置A200之相應實施例中的分離量測(例如,如上文參考 諸如分離評估器EV10之分離評估器所論述)。 一旦已在任務T30中獲得SSP濾波器ssl〇之固定濾波器 級(例如,固定濾波器級FFl〇)的所要評估結果,便可將相 應濾波器狀態載入至產出器件中作為ssp濾波器ssi〇之固 定狀態(亦即,一組固定濾波器係數值)。如下文所描述, 亦可希望執行用以校正每一產出器件中之麥克風的增益及/ 或頻率響應的程序,諸如實驗室、工廠或自動(例如,自 動增益匹配)校正程序。 在方法Ml 0之一例子中產出之經訓練固定濾波器可用於 方法M10之另一例子中以對亦使用參考器件來記錄的另一 組訓練信號進行濾波,以便計算一適應性濾波器級(例 140748.doc -112· 201013640 如’ SSP遽波器SS10之適應性漉波器級af 10)的初始條 件。一適應性濾波器之初始條件的此計算之實例描述於 2008年 8 月 25 日申請之題為「SYSTEMS,METHODS,AND APPARATUS FOR SIGNAL SEPARATION」的美國專利申 請案第12/197,9:24號中之(例如)段落[〇〇129]至[00135;|處(開 始於「It may be desirable」且結束於 rcanceiiati〇I1 in Parallel」)’該等段落以引用之方式藉此併入本文中,目 的限於描述適應性濾波器級之設計、訓練及/或實施。此 等初始條件亦可在產出期間載入至相同或類似器件之其他 例子中(例如’關於經訓練固定濾波器級)。 另外或其他,方法Ml0之一例子可經執行以獲得用於如 上文所描述之回音消除器EC 10之一或多個收斂濾波器組。 可接著使用回音消除器之經訓練濾波器來在SSP濾波器 S S 1 0之訓練信號的記錄期間對麥克風信號執行回音消除。 在一產出器件中,對由麥克風陣列產出之多頻道信號執 行操作(例如,如上文參考SSP濾波器SS10論述的空間選擇 性處理操作)的效能可取決於陣列頻道之響應特性如何良 好地彼此匹配。歸因於可包括各別麥克風之響應特性上的 差異、各別預處理級之增益位準上的差異及/或電路雜訊 位準上之差異的因素’頻道之位準有可能不同。在此種情 況下’所得多頻道信號可不提供對聲環境之準確呈現,除 非可補償麥克風響應特性之間的差異。在無此補償之情況 下’一基於此信號之空間處理操作可提供錯誤結果。舉例 而言’在低頻率下(亦即,約100 Hz至1 kHz)小如一或二分 140748.doc -113- 201013640 貝的頻道之間的振幅響應偏差可顯著減少低頻率方向性。 一麥克風陣列之頻道間不平衡之效應對於處理來自具有兩 個以上麥克風的陣列之多頻道信號的應用而言可尤其有害 的。 因此,可希望在產出期間及/或之後相對於彼此來至少 校正每一產出器件之麥克風的增益。舉例而言,可希望對 組合多麥克風音訊感測器件執行交付前校正操作(亦即, 在交付給使用者之前),以便量化該陣列之頻道之有效響 應特性之間的差異(諸如,該陣列之頻道之有效增益特性 之間的差異)。 雖然亦可對產出器件執行如上文所論述之實驗室程序, 但對每一產出器件執行此程序有可能為不切實際的。可用 以執行產出器件(例如,手機)之工廠校正的攜帶型腔室及 其他校正外殼及程序的實例描述於2008年6月30日申請之 題為「SYSTEMS, METHODS, AND APPARATUS FOR CALIBRATION OF MULTI-MICROPHONE DEVICES」的 美國專利申請案第61/077,144號中。一校正程序可經組態 以產出一將應用於各別麥克風頻道的補償因數(例如,增 益因數)。舉例而言,音訊預處理器AP10之一元件(例如, 數位預處理器D20a或D20b)可經組態以將此補償因數應用 於所感測音訊信號S10之各別頻道。 對於多數所製造之器件而言,執行交付前校正程序可耗 時過多或否則不切實際。舉例而言,對大量市場器件之每 一例子執行此操作在經濟上可為不可行的。此外,一交付 140748.doc -114- 201013640 前操作獨自可不足以在器件之壽命内確保良好效能。麥克 風靈敏性可隨著時間過去而漂移或以其他方式改變,此歸 因於可包括老化、溫度、輻射及污染的因素。然而,在未 適當地補償陣列之各個頻道之響應間的不平衡的情況下, 多頻道操作(諸如,空間選擇性處理操作)之所要效能等級 可難以或不可能達成。 因此,可希望在音訊感測器件内包括一校正常式,該校 正常式經組態以在週期性服務期間或在某其他事件後(例 ® 如,在加電時、在使用者選擇後等等)匹配一或多個麥克 風頻率性質及/或靈敏性(例如,麥克風增益之間的比率)。 此自動增益匹配程序之實例描述於2009年3月XX日申請之 題為「SYSTEMS, METHODS, AND APPARATUS FOR MULTICHANNEL SIGNAL BALANCING」的美國專利申請 案第1X/XXX,XXX號(代理人案號081747)中,該文件以引 用之方式藉此併入本文中,目的限於揭示校正方法、常 式、操作、器件、腔室及程序。 如圖77所說明,一無線電話系統(例如,CDMA、 TDMA、FDMA及/或TD-SCDMA系統)通常包括經組態以與 一無線電存取網路用無線方式通信的複數個行動用戶單元 10,該無線電存取網路包括複數個基地台12及一或多個基 地台控制器(BSC)14。此系統亦通常包括一耦接至BSC 14 的行動交換中心(MSC) 16,其經組態以將該無線電存取網 路與習知公眾交換電話網路(PSTN)l 8介接。為支援此介 接,該MSC可包括一媒體閘道器或以其他方式與一媒體閘 140748.doc •115· 201013640 道器通信’該媒體閘道器充當網路之間的轉譯單元。一媒 體閘道器經組態以在不同格式(諸如,不同傳輸及/或編碼 技術)之間轉換(例如,在分時多工(TDm)話音與ν〇Ιρ之間 轉換)且亦可經組態以執行媒體連續播送功能(諸如,回音 消除、雙時多頻率(DTMF)及音調發送)。BSC 14經由回程 線路而耦接至基地台12。該等回程線路可經組態以支援若 干種已知介面中之任一者,例如,El/τι、atm、ip、 PPP、訊框中繼、HDSL、ADSL 或 xDSL。基地台 12、Bsc
14、MSC 16及媒體閘道器(若有)之集合亦被稱作「基礎架 構」。 每一基地台12有利地包括至少一扇區(未圖示),每一扇 區包含一全向天線或一遠離基地台12放射狀地指向特定方 向的天線。或者,每一扇區可包含用於分集接收的兩個或 兩個以上m基地台12可有利地設計成支援複數個 頻率指派。一扇區與一頻率指派之相交可被稱作cdma頻 道。基地台12亦可被稱作基地台收發器子系統(bts)i2。 14及一或 」12。或
或者’「基地台」在產業中可用以共同指代bsc 多個BTS 12。BTS 12亦可表*「蜂巢小區基站 者,給定BTS 12之個別扇區可被稱作蜂巢小區基站。行 動用戶單元!0之類別通常包括如本文所描述之通信器件, 諸如蜂巢式及/或PCS(個丨通信服務)電冑、個人數位助理 (PDA),及/或具有行動電話能力的其他通信器件。此單元 1〇可包括一内部揚聲器及一麥A風陣列、㈣-揚聲器及 麥克風陣列之繫栓手機或頭戴式耳機(例如,。把手 140748.doc .116- 201013640 飛)’或包括 -、,,q <热琛頭戴式耳機 (例如,使用如由藍芽技術聯盟公司(華盛頓州貝爾維尤)發 布之藍芽協定的版本來將音訊資訊傳達至該單元的頭戴^ 耳機)。可根據IS-95標準之一或多個版本(例如,is_95X、 IS-95A、IS_95B、cdma2〇〇〇;如由電信產業聯盟(弗吉尼 亞州阿靈頓)所公布)來組態此系統使之可用。 口 現描述蜂巢式電話系統之典型操作。基地台^自多組行
動用戶單元10接收多組反向鏈路信號。該等行動用戶單元 W進行電話呼叫或其他通信。在—給定基地台12内處理由 彼基地台12接收到之每-反向鍵路信號,且將所得資料轉 發至-BSC 14。BSC 14提供呼叫資源分配及行動性管理功 此性’包括基地台12之間的軟交遞之安排I%丨4亦將接 收到之f料投送至㈣16,其衫pSTN 18之介接提供額 外投送服務。類似地,PSTN 18與Mse 與獄Μ介接,BSC14又控制基地台12將多組前向鏈路^ 號轉發至多組行動用戶單元10。 如圖77所不之蜂巢式電話系統之元件亦可經組態以支援 封包交換資料通信.如圖78所示,通常使用耦接至一連接 至外°卩封包資料網路24(例如,諸如網際網路之公眾網 路)的閘道路由器的封包資料服務節點(pDSN)22來在行動 用戶單7C 10與該封包資料網路之間投送封包資料訊務。 PDSN 22又將★料投送至—或多個封包控制功能, 其各自&多個Bsc 14且充當封包資料網路與無線電 存取網路之間的鏈路。亦可實施封包資料網路Μ以包括區 140748.doc •117· 201013640 域網路(LAN)、校園網路(CAN)、都會網路(MAN)、廣域 網路(WAN)、環狀網路、星形網路、符記環形網路等等。 連接至網路24之使用者終端機可為在如本文所描述之音訊 感測器件之類別内的器件,諸如PDA、膝上型電腦、個人 電腦、遊戲器件(此器件之實例包括XBOX及XBOX 360(微 軟公司’華盛頓州雷蒙德)、遊戲站3及攜帶型遊戲站(索尼 公司’日本東京)及貨11及£)|5(任天堂’日本京都及/或 具有音訊處理能力且可經組態以支援電話呼叫或使用諸如 VoIP之一或多個協定的其他通信的任何器件。此終端機可 包括一内部揚聲器及一麥克風陣列、包括一揚聲器及一麥 克風陣列之繫栓手機(例如,USB手機),或包括一揚聲器 及一麥克風陣列之無線頭戴式耳機(例如,使用如由藍芽 技術聯盟公司(華盛頓州貝爾維尤)發布之藍芽協定的版本 來將音訊資訊傳達至該終端機的頭戴式耳機此系統可 經組態以在不同無線電存取網路上之行動用戶單元之間 (例如,經由諸如¥〇11>之一或多個協定)、在—行動用戶單 元與一非行動使用者終端機之間,或在兩個非行動使用者 終端機之間在甚至未進入PSTN之情況下將電話呼叫或其 他通信作為封包資料訊務來載運。行動用戶單元1〇或其他 使用者終端機亦可被稱作「存取終端機」。 圖79A展示可在一器件内執行的處理語音信號之方法 M100的流程圖,該器件經組態以處理音訊信號(例如,本 文所識別之音訊感測器件中之任一者,諸如通信器件)。 方法M100包括一任務T110,任務T11〇對多頻道所感測音 140748.doc •118· 201013640 訊信號執行空間選擇性處理操作(例如,如本文中參考up 濾波器SS10所描述)以產出一源信號及—雜訊參考。舉例 而言,任務TUG可包括將多頻道所感測音訊信號之方向性 分量的能量集中至該源信號中。
方法M100亦包括一對語音信號執行頻譜對比加強操作 以產出經處理語音信號的任務。此任務包括子任務丁12〇、 TiSO及T140。任務T120基於來自雜訊參考之資訊來計算 複數個雜訊副頻帶功率估計(例如,如本文中參考雜訊副 頻帶功率估計計算器ΝΡ100所描述)。任務T13〇基於來自語 音信號之資訊來產生一加強向量(例如,如本文中參考加 強向量產生器VG100所描述)。任務τι 40基於該複數個雜 訊副頻帶功率估計、來自該語音信號之資訊及來自加強向 量之資訊來產出一經處理5吾音信號(例如,如本文中參考 增益控制元件CE100及混合器Χ100,或增益因數計算器 FC300及增益控制元件CE110或CE120所描述),使得該經 處理語音信號之複數個頻率副頻帶中之每一者係基於該語 音信號之相應頻率副頻帶。在本文中明確地揭示方法 Μ100及任務Τ110、Τ120、Τ130及Τ140之眾多實施例(例 如’依靠本文所揭示之各種裝置、元件及操作)。 可希望實施方法Μ100,使得該語音信號係基於多頻道 所感測音訊信號。圖79Β展示方法Μ100之此實施例Μ110的 流程圖,其中任務Τ130經配置以將源信號作為語音信號來 接收。在此種情況下,任務Τ140亦經配置,使得該經處理 語音信號之複數個頻率副頻帶中之每一者係基於該源信號 140748.doc -119- 201013640 之相應頻率副頻帶(例如,如本文中參考裝置Αιι〇所描 述)。 或者,可希望實施方法M100,使得該語音信號係基於 來自-經解碼語音信號之資訊。可(例如)藉由對由該器件 用無線方式接收到之信號進行解碼來獲得此經解碼語音信 號。圖80A展示方法则〇之此實施例M12〇的流程圖實 施例M120包括任務T15〇。任務Tl5〇對由該器件用無線方 式接收到之經編碼語音信號進行解碼以產出語音信號。舉 例而。,任務Τ1 50可經組態以根據本文所識別之編解碼器❹ (例如,EVRC、SMV、AMR)中之—或多者來對經編碼語 音信號進行解碼。 圖8〇B展示加強向量產生任務T130之實施例T230的流程 圖,實施例T230包括子任務T232、丁234及T236。任務 Τ232使語音信號之頻譜平滑化以獲得一第一平滑信號(例 如,如本文中參考頻譜平滑器SM1〇所描述任務丁234使 該第一平滑信號平滑化以獲得一第二平滑信號(例如,如 本文中參考頻譜平滑器SM20所描述)。任務T236計算該第⑩ 一平滑信號與該第二平滑信號之比率(例如,如本文中參 考比率計算器RC10所描述)。任務T13〇或任務Τ23〇亦可經 組態以包括一子任務,該子任務減少語音信號之頻譜峰值 之量值之間的差異(例如,如本文中參考預加強處理模組 ΡΜ10所描述)’使得加強向量係基於此子任務之結果。 圖81Α展示產出任務T14〇之實施例724〇的流程圖實施 例Τ240包括子任務Τ242、1244及1246。任務Τ242基於該 140748.doc 201013640 複數個雜訊副頻帶功率估計及基於來自加強向量之資訊來 计算複數個增益因數值,使得該複數個增益因數值中之第 一者不同於該複數個增益因數值中之第二者(例如,如本 文中參考增益因數計算器FC300所描述)。任務丁244將該第 增JBL因數值應用於該語音信號之一第一頻率副頻帶以獲 知該經處理語音信號之第一副頻帶,且任務丁246將該第二 增益因數值應用於該語音信號之一第二頻率副頻帶以獲得 «亥經處理语音信號之第二副頻帶(例如,如本文中參考增 益控制元件CE110及/或CE120所描述)。 圖81Β展示產出任務Τ240之實施例Τ34〇的流程圖,實施 例Τ340包括任務Τ244及Τ246分別之實施例丁344及Τ346。 任務340藉由使用濾波器級之級聯對語音信號進行滤波來 產出經處理語音信號(例如,如本文中參考副頻帶濾波器 陣列FA120所描述)。任務Τ344將該第一增益因數值應用於 該級聯之第一濾波器級,且任務Τ346將該第二增益因數值 應用於該級聯之第二濾波器級。 圖8 1C展示方法Μ110之實施例Μ13 0的流程圖,實施例 Μ130包括任務Τ160及Τ170。基於來自雜訊參考之資訊, 任務Τ160對源信號執行雜訊減少操作以獲得語音信號(例 如’如本文中參考雜訊減少級NR1 〇所描述)^在一實例 中’任務Τ160經組態以對源信號執行頻譜刪減操作(例 如’如本文中參考雜訊減少級NR20所描述)。任務T17〇基 於源信號與語音信號之間的關係來執行話音活動债測操作 (例如,如本文中參考VAD V15所描述)。方法Μ130亦包括 140748.doc • 121 - 201013640 任務T140之實施例T142,實施例142基於話音活動偵測任 務T170之結果來產出經處理語音信號(例如,如本文中參 考加強器EN150所描述)。 圖82A展示方法Ml 00之實施例M140的流程圖,實施例 M140包括任務T105及T180。任務T105使用回音消除器來 自多頻道所感測音訊信號消除回音(例如,如本文中參考 回音消除器EC10所描述)。任務T1 80使用經處理語音信號 來訓練回音消除器(例如,如本文中參考音訊預處理器 AP30所描述)。 圖82B展示可在一器件内執行的處理語音信號之方法 M200的流程圖,該器件經組態以處理音訊信號(例如,本 文所識別之音訊感測器件中之任一者,諸如通信器件)。 方法M200包括任務TM10、TM20及TM30。任務TM10使語 音信號之頻譜平滑化以獲得一第一平滑信號(例如,如本 文中參考頻譜平滑器SM10及任務T232所描述)。任務TM20 使該第一平滑信號平滑化以獲得一第二平滑信號(例如, 如本文中參考頻譜平滑器SM20及任務T234所描述)。任務 TM30產出一對比加強語音信號,該對比加強語音信號係 基於該第一平滑信號與該第二平滑信號之比率(例如,如 本文中參考加強向量產生器VG110及包括此產生器之加強 器EN100、EN110及EN12〇之實施例所描述)。舉例而言, 任務TM30可經組態以藉由控制語音信號之複數個副頻帶 之增益來產出對比加強語音信號,使得每一副頻帶之增益 係基於該第一平滑信號與該第二平滑信號之比率的來自一 140748.doc 201013640 相應副頻帶的資訊。 亦可實施方法M200以包括—執行適應性等化操作之任 務及/或-減少語音信號之頻譜峰值之量值之間的差異的 任務’以獲得語音信號之等化頻譜(例如,如本文中參考 預加強處理模組PM1G所描述)。在此等情況下,任務tmi〇 可經配置以使等化頻譜平滑化以獲得該第一平滑信號。 圖83Α展示根據一通用組態之用於處理語音信號之装置 ”⑽的方塊圖。裝置F1QG包括用於對多頻道所感測音訊信 號執行空間選擇性處理操作(例如,如本文中參考ssp渡波 器SS10所描述)以產出一源信號及—雜訊參考的構件 二10°舉例而言’構件G110可經組態以將多頻道所感測 音訊信號之方向性分量的能量集中至該源信號中。 裝置Fl〇〇亦包括用於對語音信號執行頻譜對比加強操作 以產出經處理語音信號的構件。此構件包括用於基於來自 雜訊參考之資訊來計算複數個雜訊副頻帶功率估計(例 ❹ 如,如本文中參考雜訊副頻帶功率估計計算器NP100所描 述)的構件G120。用於對語音信號執行頻譜對比加強操作 之構件亦包括用於基於來自語音信號之資訊來產生一加強 向量(例如,如本文中參考加強向量產生器VG1〇〇所描述) 的構件G13(^用於對語音信號執行頻譜對比加強操作的構 件亦包括構件G140,構件G140用於基於該複數個雜訊副 頻帶功率估計、來自該語音信號之資訊及來自加強向量之 資Λ來產出一經處理語音信號(例如,如本文中參考增益 控制元件CEioo及混合器χιοο,或增益因數計算sFC3〇〇 140748.doc •123· 201013640 及增益控制元件CE110或CE120所描述),使得該經處理語 音信號之複數個頻率副頻帶中之每一者係基於該語音信號 之相應頻率副頻帶。裝置F1〇〇可實施於經組態以處理音訊 信號之一器件(例如,本文所識別之音訊感測器件中之任 者,諸如通信器件)内,且在本文中明確地揭示裝置 F100、構件GU0、構件G12〇、構件Gi3〇及構件之眾 ^實施例(例如,依靠本文所揭示之各種裝置元件及操 作)。 可希望實施裝置F1 〇〇,使得該語音信號係基於多頻道所 感測音訊信號。圖83B展示裝置^⑻之此實施例FU〇的方 塊圖,其中構件G130經配置以將源信號作為語音信號來接 收。在此種情況下,構件G140亦經配置,使得該經處理語 音信號之複數個頻率副頻帶中之每—者係基於該源信號之 相應頻率副頻帶(例如,如本文中參考裝置AM所描述卜 或者,可希望實施裝置F100,使得該語音信號係基於來 自一經解碼語音信號之資訊。可(例如)藉由對由該器件用 無線方式接收到之信號進行解碼轉得此贿碼語音信 號圖84A展不裝置F100之此實施例F12_方塊圖,實施 例卿包括用於對由該器件用無線方式接收到之經編碼語 音信號進行解瑪以產出語音信號的構件gi5q。舉例而古, 構件⑴50可經組態以根據本文所識別之編解碼器(例如 EVRC、SMV、AMR)中之—或多者來對經編碼語音信號進 行解碼。 圖84B展示用於產生加強^ 強向量之構件G130的實施例〇230 140748.doc •124- 201013640 的流程圖,實施例G230包括用於使該語音信號之頻譜平滑 化以獲得一第一平滑信號(例如,如本文中參考頻譜平滑 器SM10所描述)的構件G232、用於使該第一平滑信號平滑 化以獲得一第二平滑信號(例如,如本文中參考頻譜平滑 器SM20所描述)的構件G234,及用於計算該第—平滑信號 與s亥第二平滑信號之比率(例如,如本文中參考比率計算 器RC10所描述)的構件G236。構件G130或構件G230亦可經 組態以包括用於減少語音信號之頻譜峰值之量值之間的差 異(例如,如本文中參考預加強處理模組PM1〇所描述)使得 加強向量係基於此差異減少操作之結果的構件。 圖85A展示構件G140之實施例G240的方塊圖,實施例 G240包括用於基於該複數個雜訊副頻帶功率估計及基於來 自加強向量之資訊來計算複數個增益因數值使得該複數個 增益因數值中之第一者不同於該複數個増益因數值中之第 二者(例如,如本文中參考增益因數計算器FC3〇〇所描述) 的構件G242。構件G240包括用於將該第一增益因數值應 用於該sf音信號之一第一頻率副頻帶以獲得該經處理語音 信號之第一副頻帶的構件G244及用於將該第二增益因數值 應用於該語音彳s號之一第二頻率副頻帶以獲得該經處理語 音"is说之第·一副頻帶的構件G246(例如,如本文中參考增 益控制元件CE110及/或CE120所描述)。 圖85B展示構件G240之實施例(3340的方塊圖,實施例 G340包括經配置以對語音信號進行濾波以產出經處理語音 信號(例如’如本文中參考副頻帶濾波器陣列FA 120所描 140748.doc -125· 201013640 述)的濾波器級之級聯。構件G340包括用於將該第一增益 因數值應用於該級聯之一第一濾波器級的構件G244之實施 例G344及用於將該第二增益因數值應用於該級聯之一第一 濾波器級的構件G246之實施例G346。 魯 圖85C展示裝置F110之實施例F130的流程圖,實施例 F130包括用於基於來自雜訊參考之資訊對源信號執行雜訊 減少操作以獲得語音信號(例如,如本文中參考雜訊減少 級NR10所描述)的構件G160。在一實例中,構件Gl6〇經組 態以對源信號執行頻譜删減操作(例如,如本文中參考雜 訊減少級NR20所描述)。裝置F130亦包括用於基於源信號 與語音信號之間的關係來執行話音活動偵測操作(例如, 如本文中參考VAD V1 5所描述)的構件G170。裝置f 130亦 包括用於基於話音活動偵測操作之結果來產出經處理語音 信號(例如,如本文中參考加強sEN15〇所描述)的構件 G140之實施例〇142。 圖86A展示裝置F1〇〇之實施例^扣的流程圖實施例 F140包括用於自多頻道所感測音訊信號消除回音(例如,_ 如本文中參考回音消除器EC1〇所描述)的構件G1〇5。構件 G105經組態及經配置以用經處理語音信號來訓練(例如, 如本文中參考音訊預處理器AP30所描述)。 圖86B展示根據一通用組態之用於處理語音信號之裝置 F200的方塊圖。裝置F2〇〇可實施於經組態以處理音訊信號 的一器件(例如’本文所識別之音訊感測器件中之任一 者諸如通钨器件)内。裝置F200包括如上文所描述之用 140748.doc -126- 201013640 於平滑的構件G232及用於平滑的構件G234。裝置F200亦 包括用於產出一對比加強語音信號的構件G144,該對比加 強語音信號係基於該第一平滑信號與該第二平滑信號之比 率(例如,如本文中參考加強向量產生器VG110及包括此產 生器之加強器ΕΝ 1 00、EN110及EN120之實施例所描述)。 舉例而言,構件G144可經組態以藉由控制語音信號之複數 個副頻帶之增益來產出對比加強語音信號,使得每一副頻 帶之增益係基於該第一平滑信號與該第二平滑信號之比率 的來自一相應副頻帶的資訊。 亦可實施裝置F200以包括用於執行適應性等化操作之構 件及/或用於減少語音信號之頻譜峰值之量值之間的差異 的構件,以獲得語音信號之等化頻譜(例如,如本文中參 考預加強處理模組PM10所描述)。在此等情況下,構件 G232可經配置以使等化頻譜平滑化以獲得該第一平滑信 號。 提供所述組態之前述呈現以使任何熟習此項技術者能夠 製造或使用本文所揭示之方法及其他結構。本文所展示並 描述之流程圖、方塊圖、狀態圖及其他結構僅為實例,且 此等結構之其他變型亦處於本揭示案之範疇内。對此等組 態之各種修改為可能的,且本文中所呈現之一般原理亦可 應用於其他組態。因此,本揭示案不欲限於上文所展示之 組態,而係符合與在本文中以任何方式揭示之原理及新穎 特徵一致的最廣泛範疇(包括於所申請之附加申請專利範 圍中),該申請專利範圍形成原始揭示案之一部分。 H0748.doc -127- 201013640 明確地預期且藉此揭示’本文中所揭示之通信器件可瘦 調適以用於經封包交換(例如’經配置以根據諸如⑽之 協定來載運音訊傳輸的有線及/或無線網路)及/或電路交換 之網路中。亦明確地預期且藉此揭示,本文中所揭示之通 信器件可經調適以用於窄頻帶編碼系統(例如,對約四或 五千赫之音訊頻率範圍進行編碼的系統)中及/或用於寬頻 帶編碼系統(例如’對大於五千赫之音訊頻率進行編瑪的 系統)中’包括全頻帶寬頻帶編瑪m分割頻帶寬頻帶 編碼系統。 熟習此項技術者應理解,可使用多種不同技術 (technology及technique)中之任一者來表示資訊及信號。 舉例而言,可藉由電壓、電流、電磁波、磁場或磁粒子、 光場或光粒子或其任何組合來表示可在整個上述描述中提 及的資料、指令、命令、資訊、信號、位元及符號。 如本文所揭示之組態的實施例的重要設計要求可包括最 小化處理延遲及/或計算複雜性(通常以每秒數百萬個指令 或MIPS來量測),尤其對於計算密集應用(諸如,壓縮音訊 或視聽資訊(例如,根據諸如本文所識別之實例中之一者 的壓縮格式來編碼的檔案或流)之播放)或在較高取樣速率 下之話音通信(例如’關於寬頻帶通信)的應用而言。 可以被認為適合於所欲應用的硬體、軟體及/或韌體之 任何組合來具體化如本文所揭示之裝置的實施例之各種元 件(例如,裝置 A100、A110、A120、A130、A132、 A134、A140、A150、A160、A165、A170、A180、 140748.doc -128- 201013640 A200 、 A210 、 A230 、 A250 、 A300 、 A310 、 A320 、 A330、A400、A500、A550、A600、Fl00、F110、F12〇、 FI30、F140及F200之各種元件)。舉例而言,可將此等元 件製造為駐留於(例如)同一晶片上或晶片組中之兩個或兩 個以上晶片間的電子及/或光學器件。此器件之一實例為 固疋或可程式化邏輯元件(諸如,電晶體或邏輯閘)之陣 列,且此等元件中之任一者可實施為一或多個此等陣列。 此等元件中之任何兩者或兩者以上或甚至所有可實施於同 一陣列或多個陣列内。此或此等陣列可實施於一或多個晶 片内(例如,包括兩個或兩個以上晶片之晶片組内)。 本文所揭示之裝置之各種實施例的一或多個元件(例 如,如上文所列舉)亦可整個或部分地實施為一或多個指 令集,該一或多個指令集經配置以在一或多個固定或可程 式化邏輯元件陣列(諸如,微處理器、嵌入式處理器、ιρ 核心、數位信號處理器、場可程式化閘陣列(FpGA)、特殊 應用標準產品(ASSp)及特殊應用積體電路(ASIC))上執 订。如本文所揭示之裝置之一實施例的各種元件中的任一 者亦可具體化為一或多個電腦(例如,包括經程式化以執 行,或多個才曰令集或指令序列之一或多個陣列的機器,亦 被稱為處理器」)’且此等元件中之任何兩者或兩者以 上或甚至所有可實施於相同的此或此等電腦内。 可將如本文所揭示之處理器或其他處理構件製造為駐留 於(例如)同一晶片上或晶片組中之兩個或兩個以上晶片間 的一或多個電子及/或光學器件。此器件之一實例為固定 140748.doc -129- 201013640 ,程式化邏輯元件(諸如,電晶體或邏輯閘)之陣列,且 凡件中之任一者可實施為一或多個此等陣列。此或此 、Ρ =可實施於一或多個晶片内(例如,包括兩個或兩個 . 片之曰曰片組内)。此等陣列之實例包括固定或可程
式化邏輯元件陣列,諸如微處理器、嵌入式處理器、㈣ P FPGA、ASSP及ASIC。如本文所揭示之處理器 或其他處理構件亦可具體化為一或多個電腦(例如,包括 經程式化以執行-或多個指令集或指令序列之—或多個陣 歹J的機③)或其他處理器。如本文所描述之處理器有可能 用以執行與信財㈣料直接相㈣任務或執行與信號 平衡程序不直接相關的其他指令集,諸如與處理器所叙入 於其中之器件或系統(例如,音訊感測器件)之另一操作有 關的任務。亦可能,如本文所揭示之方法之—部分由該音 訊感測器件之處理器執行(例如,任務Tu〇、τΐ2〇及 丁130;或任務丁110、丁12〇、713〇及丁242),且該方法之另 一部分係在一或多個其他處理器之控制下加以執行(例 如’解碼任務Τ150及/或增益控制任務了244及1246)。 熟習此項技街者將瞭解,結合本文所揭示之組態而描述 的各種說明性模組、邏輯區塊、電路及操作可實施為電子 硬體、電腦軟體或兩者之組合。可用經設計以產出如本文 所揭示之組態的通用處理器、數位信號處理器(Dsp)、 ASIC或ASSP、FPGA或其他可程式化邏輯器件、離散閘或 電晶體邏輯、離散硬體組件或其任何組合來實施或執行此 等模組、邏輯區塊、電路及操作。舉例而言,此組態可至 140748.doc •130. 201013640 :部分地實施為一硬連線電路、製 中之電路組態,或載入至非揮發性錯存器t =體電路 二 =可讀碼自,錯存媒體載 存媒體中之軟體程式,此媽為可由邏輯元件陣列(::儲 通用處理器或其他數位俨铲虛 U諸如, 處理器可為微處理器,二替處代理^ 1一在替代例中,處理器
:處理器、控制器、微控制器或狀態機。處理器亦:: 為計算器件之組合,例如,Dsp與微處理器之組合、2 個微處理器、-或多個微處理器結合⑽核心,或任何其 他此種組態。軟體模組可駐留於隨機存取記憶體(ra⑷、、 唯讀記憶體(ROM)、諸如快閃RAM之非揮發性 RAM(NVRAM)、可抹除可程式化r〇m(epr〇m)、電可抹 除可程式化ROM(EEPROM)、暫存器、硬碟、抽取式磁 碟、CD-ROM,或此項技術中已知之任何其他形式的儲存 媒體中。一說明性儲存媒體耦接至處理器,使得處理器可 自儲存媒體讀取資訊及將資訊寫入至儲存媒體。在替代例 中’儲存媒體可與處理器整合。處理器及儲存媒體可駐留 於ASIC中。ASIC可駐留於使用者終端機中。在替代例 中’處理器及儲存媒體可作為離散組件而駐留於使用者終 端機中。 請注意,可藉由諸如處理器之邏輯元件陣列來執行本文 所揭示之各種方法(例如,方法M100、M110、M120、 M130、M140及M200 ’以及此等方法及在本文中依靠對如 本文所揭示之裝置之各種實施例的操作的描述來明確地揭 140748.doc • 131 · 201013640 示的額外方法的本多實施例),且可將如本文所描述之裝 置的各種元件實施為設計成在此陣列上執行㈣組。如本
文所使用,射吾「模組」或「子模組」可指代包括呈軟 體、硬體或勒體形式之電腦指令(例如,邏輯表式)的任何 方法、裝置、器件、單元或電腦可讀資料储存媒體。應理 解,可將多個模組或系統組合成一個模組或系統,且可將 -個模組或純分成多健組或系統以執行相同功能。在 以軟體或其他電腦可執行指令來實施時,一處理之元件基 本上為用以執行相關任務之碼段,諸如常式、程式、^ 件、組件、資料結構及其類似者。術語「軟體」應被理解 為包括原始碼、組合語言媽、機器碼、二進位瑪、孰體、 巨碼、微碼、可由邏輯元件陣列執行之任何一或多個指令 集或指令序列,及此等實例之任何組合。程式或媽段可储 存於處理器可讀媒體t或可經由傳輸媒體或通信鏈路藉由 具體化於載波中之電腦資料信號來傳輸。
本文所揭示之方法、方案及技術的實施例亦可有形地具 體化(例如,在本文所列出之一或多個電腦可讀媒體 可由:包括邏輯元件陣列(例如,處理器、微處理器、微 控制器或其他有限狀態機)的機器讀取及㈤執行之一或多 個指令集。術語「電腦可讀媒體」可包括可儲存或傳遞資 訊的任何媒艘,包括揮發性、非揮發性、抽取式及非抽取 式媒體。電腦可讀媒體之實例包括電子電路、半導體記憶 體器件、ROM、快閃記憶體、可抹除r〇m(er〇m)、軟碟 或其他磁㈣存器、CD_R⑽歸或其他光學儲存器、硬 140748.doc -132- 201013640 碟、光纖媒體、射頻(RF)鏈路,或可用以储存所要資訊且 可被存取的任何其他媒體。電腦資料信號可包括可經由傳 輸媒體(諸如,電子網路頻道、光纖、空氣、電磁、奸鏈 路等等)來傳播的任何信號。可經由諸如網際網路或企業 内部網路之電腦網路來下載碼段。在任何情況下,本揭; 案之範疇不應被理解為受此等實施例所限制。 可以硬體、由處理器執行之軟體模組或該兩者 ❹ 參 2地具體化本文所描述之方法的任❹之每一者。在: 本文所揭示之方法之實施例的典 :個邏輯,陣列經組態,該方法之
At、固以上或甚至所有。亦可將任務中之一或多 (可能所以)實施為具體化於電腦程式—戈 資料錯存媒體’諸如磁碟、快閃或其他非揮發性記=個 :導體s己憶體晶片等)中之程式碼(例如,一或多個扑人 該電腦程式產品可由包括邏輯元件陣列(例如a 7 ::處理器、微控制器或其他有限 ’= 如,電腦)讀取及/或執行。亦可藉由一個以上=機器(例 =來執行如本文所揭示之方法的實施例之任# ,列或 ^其他實施例中,可在用於無線通信 在此等 式電話或具有此通信能力的其他器==,蜂巢 件可經組態以與電路交換及 )内執仃任務。此器 使用諸如ν〇ΙΡ之-或多個協定)。舉例而+路:信(例如’ 括經組態以接收及/或傳輸經編码;電此器件可包 明確地揭示,可藉由諸如手機 F電路。 機碩戴式耳機或攜帶型數 140748.doc •133· 201013640 位助理(PDA)之攜㈣通㈣件來執行本文所揭示之各種 方法,且本文所描述之㈣裝置可包括於此器件内。典型 實時(例如,線上)應用為使用此行動器件進行之電話合 在 或多個例示性實施例中’可以硬體、軟體、勒體或 其任何組合來實施本文所描述之操作。若讀體來實施, 則此等操作可作為-❹個指令或程式⑽儲料電腦可 讀媒體上或經由電腦可讀媒體來傳輸。術語「電腦可讀媒 體」包括電腦儲存媒體及通信媒體兩者,通信媒體包括促 進將電腦程式自一處傳遞至另一處的任何媒體。储存媒體 可為可由電腦存取之任何可用媒體。舉例而言且非限制, 此電腦可讀媒體可包含儲存元件陣列,諸如半導體記憶體 (其可包括(不限於)動態或靜態RAM、r〇m、eepr〇mw 或快閃RAM),或鐵電、磁阻、雙向、聚合或相變記憶 體;CIMU)M或其他光碟储存器、磁碟儲存器或其他㈣ 儲存器件,或可用於載運紐存呈指令或f料結構之形式 的所要程式碼且可由電腦存取的任何其他媒體。又,將任 何連接適當地稱作電腦可讀媒體。舉例而言,若使用一同 轴電纜、光纖電纜、雙絞線、數位用戶線(DSL)或諸如紅 外、無線電及微波之無線技術來自、網站、伺服器或其他遠 端源傳輸軟體,則該同軸電纜、光纖電纜、雙絞線、 DSL’或諸如紅外、無線電及/或微波之無線技術係包括於 媒體之定義中。如本文中使用’磁碟及光碟包括緊凑光碟 (CD)、雷射光碟、光學光碟、數位化通用光碟(dvd)、軟 140748.doc •134· 201013640 性磁碟及Blu-ray DiSCTM(藍光光碟協會,加利福尼亞州環 球影城),其中磁碟通常以磁性方式來再生資料,而光碟 用雷射以光學方式來再生資料。上述各者之組合亦應包括 於電腦可讀媒體之範疇内。 如本文所描述之聲信號處理裝置可併入於一接受語音輸 入以便控制某些操作或可以其他方式受益於所要雜訊與背 景雜訊之分離的電子器件(諸如,通信器件)中。許多應用 可受益於加強清楚之所要聲音或將其與發自多個方向的背 〇 景聲音分離。此等應用可包括在併有諸如話音辨識及偵 測、語音加強及分離、話音啟動之控制及其類似者的能力 的電子或計算器件中的人機介面。可希望實施此聲信號處 理裝置以使之在僅提供有限處理能力之器件中為適合的。 可將本文所描述之模組、元件及器件之各種實施例的元 件製造為駐留於(例如)同一晶片上或晶片組之兩個或兩個 以上晶片間的電子及/或光學器件。此器件之一實例為固 ❹ 定或可程式化邏輯元件(諸如,電晶體或閘)之陣列。本文 所描述之裝置之各種實施例的一或多個元件亦可整個或部 分地實施為一或多個指令集,該一或多個指令集經配置以 在一或多個固定或可程式化邏輯元件陣列(諸如,微處理 器、散入式處理器、IP核心、數位信號處理器、FpGA、 ASSP及ASIC)上執行。 如本文所描述之裝置之實施例的一或多個元件有可能用 以執行與該裝置之一操作不直接相關的任務或執行與該裝 置之一操作不直接相關的其他指令集,諸如與該裝置所嵌 140748.doc •135· 201013640 =於其中之ϋ件或系統的另—操作有關的 實施例之-或多個元件亦有可能具此裝置之 =在不同時間執行對應於不同元件之程式碼部分的處理 :隹經執行以在不同時間執行對應於不同元件之任務的指 :集’或在不同時間對不同元件執行操作之電子及/或光 學'件的配置P舉例而言’可實施副頻帶信號產生器 SGH)0、EG100、NG100a、則_及 NGi〇〇c 中之多者中 的兩者以在不同時間包括相同結構。在另—實例中,可實 施副頻帶功率估計計算器SP100' EP100、Npl00a、 刪_(或NP105)及NP100C中之多者中的兩者以在不同時 間包括相同結構。在另-實例中,可實施副頻帶遽波器陣 列FAH)0及副頻帶濾'波器陣列s⑽之—或多個實施例以在 不同時間包括相同結構(例如,纟不同時間使用不同組之 濾波器係數值)。 亦明確地預期且藉此揭示,在本文中參考裝置A100之特 定實施例及/或加強器EN10描述的各種元件亦可以所描述 之方式與其他所揭示實施例一起使用。舉例而言,AGC模 組G10(如參考裝置Al7〇所描述)、音訊預處理器Api〇 (如參 考裝置A500所描述)、回音消除器EC10(如參考音訊預處理 器AP30所描述)、雜訊減少級NR10(如參考裝置A13〇所描 述)或NR20,及話音活動偵測器V10(如參考裝置A16〇所描 述)或V15(如參考裝置A165所描述)中之一或多者可包括於 裝置A100之其他所揭示實施例中。同樣,峰值限制器 L10(如參考加強器ΕΝ40所描述)可包括於加強器ΕΝ10之其 140748.doc -136- 201013640 他所揭示實旅例中。儘管在上文主要描述對所感測音訊信 號S10之雙頻道(例如,立體聲)例子的應用,但亦在本文 中明確地預期及揭示本文所揭示之原理至所感測音訊信號 S 10之具有三個或二個以上頻道(例如,來自三個或三個以 上麥克風之陣列)的例子的擴展。 【圖式簡單說明】 ' 圖1展示一清晰度指標曲線圖; 圖2展示在典型窄頻帶電話應用中一再生語音信號之功 ❹ 率譜; 圖3展示典型語音功率譜及典型雜訊功率譜之實例; 圖4A說明自動音量控制對圖3之實例的應用; 圖4B說明副頻帶等化對圖3之實例的應用; 圖5展示根據一通用組態之裝置A10〇的方塊圖; 圖όΑ展示裝置入100之實施例A110的方塊圖; 圖6B展示裝置A100(及裝置A110)之實施例A120的方塊 圖; 圖7展示空間選擇性處理(SSP)濾波器SS10之一實例的波 . 束圖形; 圖8A展示SSP濾波器SS10之實施例SS2〇的方塊圖; • 圖88展示裝置A100之實施例A130的方塊圖; 圖9A展示裝置A130之實施例A132的方塊圖; 圖9B展示裝置A132之實施例A134的方塊圖; 圖10A展示裝置A130(及裝置A110)之實施例A140的方塊 圖; 140748.doc -137- 201013640 圖10B展示裝置A140(及裝置A120)之實施例A150的方塊 圖11A展示SSP濾波器SS10之實施例SS110的方塊圖; 圖11B展示SSP濾波器SS20及SS110之實施例SS120的方 塊圖; 圖12展示加強器ΕΝ 10之實施例ΕΝ 100的方塊圖; 圖13展示一語音信號之訊框的量譜; 圖14展示對應於圖13之譜的加強向量EV10之一訊框; 圖15至圖18分別展示一語音信號之量譜、該量譜之平滑 型式、該量譜之雙平滑型式及該平滑譜與該雙平滑譜之比 率的實例; 圖19A展示加強向量產生器VG100之實施例VG110的方 塊圖; 圖19B展示加強向量產生器VGU〇之實施例VG12〇的方 塊圖; 圖20展示自圖13之量譜產出的平滑信號之實例; 圖21展示自圖20之平滑信號產出的平滑信號之實例; 圖22展示§吾音彳§號S40之訊框的加強向量之實例; 圖23 A展示用於動態範圍控制操作之轉移函數的實例; 圖23B展示動態範圍壓縮操作對三角波形的應用; 圖24A展示用於動態範圍壓縮操作的轉移函數之實例; 圖24B展示動態範圍壓縮操作對三角波形的應用; 圖25展示一適應性等化操作的實例; 圖26A展示副頻帶信號產生器SG200之方塊圖; 140748.doc •138- 201013640 圖26B展示副頻帶信號產生器SG300之方塊圖; 圖26C展示副頻帶信號產生器SG400之方塊圖; 圖26D展示副頻帶功率估計計算器EC110的方塊圖; 圖26E展示副頻帶功率估計計算器EC120的方塊圖; 圖27包括指示一組七個巴克標度(Bark scale)副頻帶之邊 ' 緣的一列點; : 圖28展示副頻帶濾波器陣列SG10之實施例SG12的方塊 圖; ® 圖29A說明一通用無限脈衝響應(IIR)濾波器實施例之轉 置直接形式II ; 圖29B說明一 IIR濾波器之雙二階實施例的轉置直接形式 II結構; 圖30展示一 IIR濾波器之雙二階實施例之一實例的量值 及相位響應曲線圖; 圖3 1展示一連串七個雙二階濾波器之量值及相位響應; 圖32展示加強器EN10之實施例EN110的方塊圖; 圖33A展示混合因數計算器FC200之實施例FC250的方塊 . 圖; • 圖33B展示混合因數計算器FC250之實施例FC260的方塊 ' 圖; 圖33C展示增益因數計算器FC300之實施例FC310的方塊 ran · 圖, 圖3 3D展示增益因數計算器FC300之實施例FC320的方塊 圖; 140748.doc -139- 201013640 圖34A展示一偽碼列表; 圖34B展示圖34A之偽碼列表的修改; 圖35A及圖35B分別展示圖34A及圖34B之偽碼列表的修 改; 圖3 6 A展示增益控制元件CE110之實施例CE11 5的方塊 面 · 圃, 圖36B展示副頻帶濾波器陣列FA100的包括並聯配置之 一組帶通濾波器的實施例FA110之方塊圖; 圖37A展示副頻帶濾波器陣列FA100的帶通濾波器串聯 _ 配置之實施例FA120的方塊圖; 圖37B展示一 IIR濾波器之雙二階實施例的另一實例; 圖38展示加強器EN10之實施例EN120的方塊圖; 圖39展示增益控制元件ce 120之實施例CE130的方塊 園, 圖40A展示裝置A100之實施例A160的方塊圖; 圖40B展示裝置八140(及裝置a16〇)之實施例八165的方塊 圖; 圖41展示圖35A之偽碼列表的修改; 圖42展示圖35A之偽碼列表的另一修改; 圖43A展示裝置幻00之實施例A17〇的方塊圖; 圖438展不装置A17〇之實施例A18〇的方塊圖; 圖44展不加強器ENu〇之包括峰值限制器u〇的實施例 EN160的方塊圖; 圖45A展示描述峰值限制操作之一實例的偽碼列表; 140748.doc -140· 201013640 圖45B展示圖45A之偽碼列表的另一型式; 圖46展示裝置A100之包括一分離評估器EV10之實施例 A200的方塊圖; 圖47展示裝置A200之實施例A2 10的方塊圖; 圖48展示加強器EN200(及加強器EN110)之實施例EN300 的方塊圖; 圖49展示加強器EN300之實施例EN310的方塊圖; 圖5 0展示加強器EN300(及加強器EN310)之實施例EN320 ❹ 的方塊圖; 圖51A展示副頻帶信號產生器EC210之方塊圖; 圖51B展示副頻帶信號產生器EC210之實施例EC220的方 塊圖, 圖52展示加強器EN320之實施例EN330的方塊圖; 圖53展示加強器EN110之實施例EN400的方塊圖; 圖54展示加強器EN110之實施例EN450的方塊圖; 圖55展示裝置A100之實施例A250的方塊圖; 參 圖56展示加強器EN450(及加強器EN400)之實施例EN460 的方塊圖; 圖57展示裝置A2 10之包括話音活動偵測器V20的實施例 A230 ; 圖58A展示加強器EN400之實施例EN55的方塊圖; 圖5 8B展示功率估計計算器EC 120之實施例EC 125的方塊 圖; 圖59展示裝置A100之實施例A300的方塊圖; 140748.doc -141 - 201013640 圖60展示裝置A300之實施例A310的方塊圖; 圖61展示裝置A3 10之實施例A320的方塊圖; 圖62展示裝置A100之實施例A400的方塊圖; 圖63展示裝置A100之實施例A500的方塊圖; 圖64A展示音訊預處理器AP10之實施例AP20的方塊圖; 圖64B展示音訊預處理器AP20之實施例AP30的方塊圖; 圖65展示裝置A310之實施例A330的方塊圖; 圖66A展示回音消除器EC10之實施例EC12的方塊圖; 圖66B展示回音消除器EC20a之實施例EC22a的方塊圖; 圖66C展示裝置A110之實施例A600的方塊圖; 圖67A展示第一操作組態中之雙麥克風手機H100的圖; 圖67B展示手機H100之第二操作組態; 圖68A展示手機H100之包括三個麥克風的實施例H110的 圖; 圖68B展示手機H110的兩個其他視圖; 圖69A至圖69D分別展示多麥克風音訊感測器件D300之 仰視圖、俯視圖、正視圖及側視圖; 圖70A展示頭戴式耳機之不同操作組態之範圍的圖; 圖70B展示免持車載裝置之圖; 圖71A至圖71D分別展示多麥克風音訊感測器件D350之 仰視圖、俯視圖、正視圖及側視圖; 圖72A至圖72C展示媒體播放器件之實例; 圖73A展示通信器件D100之方塊圖; 圖73B展示通信器件D100之實施例D200的方塊圖; 140748.doc -142- 201013640 圖74A展示聲碼器VC10的方塊圖; 圖74B展示編碼器ENC100之實施例ENC110的方塊圖; 圖75A展示設計方法M10的流程圖; 圖75B展示經組態以用於記錄訓練資料之消聲腔室的實 例; 圖76A展示適應性濾波器結構FS 1 0之雙頻道實例的方塊 圖; 圖76B展示濾波器結構FS10之實施例FS20的方塊圖; β 圖77說明一無線電話系統; 圖78說明經組態以支援封包交換資料通信的無線電話系 統; 圖79Α展示根據一通用組態之方法Μ100的流程圖; 圖79Β展示方法Μ100之實施例Μ110的流程圖; 圖80Α展示方法Μ1 00之實施例Μ120的流程圖; 圖80Β展示任務Τ130之實施例Τ230的流程圖; 圖81Α展示任務Τ140之實施例Τ240的流程圖; 圖81Β展示任務Τ240之實施例Τ340的流程圖; 圖81C展示方法Μ110之實施例Μ130的流程圖; 圖82Α展示方法Μ100之實施例Μ140的流程圖; 圖82Β展示根據一通用組態之方法Μ200的流程圖; 圖83Α展示根據一通用組態之裝置F100的方塊圖; 圖83Β展示裝置F100之實施例F110的方塊圖; 圖84Α展示裝置F100之實施例F120的方塊圖; 圖84Β展示構件G130之實施例G230的方塊圖; 140748.doc -143 - 201013640 圖85A展示構件G140之實施例G240的方塊圖; 圖85B展示構件G240之實施例G340的方塊圖; 圖85C展示裝置F110之實施例F130的方塊圖; 圖86A展示裝置F100之實施例F140的方塊圖;及 圖86B展示根據一通用組態之裝置F200的方塊圖。 在此等圖式中,除非上下文另有指示,否則相同標記之 使用指示相同結構之例子。 【主要元件符號說明】 10 行動用戶單元 12 基地台 14 基地台控制器 16 行動交換中心 18 公眾交換電話網路 20 封包控制功能 22 封包資料服務節點 24 外部封包資料網路 64 使用者之嘴巴 65 使用者之耳朵 66 操作組態之範圍 67 主要麥克風及次要麥克風之陣列 83 車載裝置 84 Μ麥克風陣列 85 揚聲器 A 信號 140748.doc -144- 201013640
A100 裝置 A110 裝置 A120 裝置 A130 裝置 A132 裝置 A134 裝置 A140 裝置 A150 裝置 A160 裝置 A165 裝置 A170 裝置 A180 裝置 A200 裝置 A210 裝置 A230 裝置 A250 裝置 A300 裝置 A310 裝置 A320 裝置 A330 裝置 A400 裝置 A500 裝置 A550 裝置 A600 裝置 140748.doc -145- 201013640 AF10 適應性濾波器級 AP10 音訊預處理器 AP20 音訊預處理器 AP30 音訊預處理器 CIO 小鍵盤 ClOa 第一類比數位轉換器 ClOb 第二類比數位轉換器 C20 顯示器 C30 天線 C40 天線 C110 反饋慮波器 C120 反饋慮波器 CE10 渡波器 CE20 加法器 CE100 增益控制元件 CE110 增益控制元件 CE115 增益控制元件 CE120 增益控制元件 CE130 增益控制元件 CS10 晶片/晶片組/編碼方案選擇信號 D100 通信器件 D110 直接型濾波器 D120 直接型濾波器 D200 通信器件 140748.doc 146· 201013640 D300 D310 D350
D400 D410 D420 DEC100 Dll Ο DM10-1 DM10-2 DS10 DSC10 E10 E20 E(i) EC10 EC12 EC20 EC20a EC20b EC22a EC25 ECHO 無線頭戴式耳機 頭戴式耳機 多麥克風攜帶型音訊感測器件/頭戴式 耳機 器件 器件 器件 解碼器 距離指示信號 數位化麥克風信號 數位化麥克風信號 距離處理模組 顯示螢幕 近端經編碼語音信號 遠端經編碼語音信號 副頻帶功率估計 回音消除器 回音消除器 平滑器 單頻道回音消除器 單頻道回音消除器 回音消除器 平滑器 副頻帶功率估計計算器 140748.doc -147- 201013640 EC120 副頻帶功率估計計算器 EC125 功率估計計算器 EC210 副頻帶信號產生器 EC220 副頻帶信號產生器 EG100 加強副頻帶信號產生器 EN10 加強器 ENlOa 加強器 ENlOb 加強器 EN55 加強器 EN100 加強器 EN110 加強器 EN120 加強器 EN150 加強器 EN160 加強器 EN200 加強器 EN300 加強器 EN310 加強器 EN320 加強器 EN330 加強器 EN400 加強器 EN450 加強器 EN460 加強器 EN500 加強器 ENC10 有作用訊框編碼器 140748.doc -148- 201013640 ENC20 無作用訊框編碼器 ENC100 編碼器 ENC110 編碼器 EP100 加強副頻帶功率估計計算器 EQ10 等化器 ES10 經等化之音訊信號 EV10 加強向量 EV12 加強向量 β F10-l-F10-q 帶通濾波器 FlOa 高通慮波器 FlOb 高通濾波器 F20-l-F20-q 帶通濾波器 F100 用於處理語音信號之裝置 F110 用於處理語音信號之裝置 F120 用於處理語音信號之裝置 F130 用於處理語音信號之裝置 F140 用於處理語音信號之裝置 F200 用於處理語音信號之裝置 FA100 副頻帶濾波器陣列 FA110 副頻帶濾波器陣列 FA120 副頻帶濾波器陣列 FC100 副頻帶增益因數計算器 FC200 副頻帶混合因數計算器 FC250 混合因數計算器 140748.doc -149- 201013640 FC260 FC300 FC310 FC320 FF10 FS10 FS20 G(l)-G(q) G(i) G10 G20-l-G20-q G105 G110 G120 G130 G140 混合因數計算器 副頻帶增益因數計算器 增益因數計算器 增益因數計算器 固定濾波器/固定濾波器級 適應性濾波器結構/反饋結構 濾波器結構 增益因數 增益因數 自動增益控制模組 副頻帶增益控制元件 用於自多頻道所感測音訊信號消除回音 的構件 用於對多頻道所感測音訊信號執行空間 選擇性處理操作以產生一源信號及一雜 訊參考的構件 用於基於來自雜訊參考之資訊來計算複 數個雜訊副頻帶功率估計的構件 用於基於來自s吾音信號之資訊來產生一 加強向量的構件 用於基於該複數個雜訊副頻帶功率估 叶、來自該語音信號之資訊及來自加強 向量之資訊來產出—經處理之語音信號 的構件 140748.doc 201013640 G142 G144 G150 G160 ® G170 G230 G232 G234 G236 ❷ G240 G242 用於基於話音㈣彳貞測操作之結果來產 出經處理語音信號的構件 用於產出一對比加強語音信號的構件 用於對由該ϋ件用無線方式接收到之經 編碼語音信號進行解碼以產出語音信號 的構件 用於基於來自雜訊參考之資訊對源信號執 行雜訊減少操作以獲得語音信號的構件 用於基於源信號與語音信號之間的關係 來執行話音活動偵測操作的構件 用於產生加強向量之構件 用於使該語音信號之頻譜平滑化以獲得 一第一平滑信號的構件 用於使該第一平滑信號平滑化以獲得一 第二平滑信號的構件 用於計算該第一平滑信號與該第二平滑 信號之比率的構件 用於基於該複數個雜訊副頻帶功率估 計、來自該語音信號之資訊及來自加強 向量之資訊來產出一經處理語音信號的 構件 用於基於該複數個雜訊副頻帶功率估計 及基於來自加強向量之資訊來計算複數 個增益因數值使得該複數個增益因數值 140748.doc •151- 201013640 G244 G246 G340 G344 G346 GC10 GC20 GC25 H100 H110 11 12 L10 140748.doc 中之第一者不同於該複數個增益因數值 中之第二者的構件 用於將該第一增益因數值應用於該語音 信號之一第一頻率副頻帶以獲得該經處 理語音信號之第一副頻帶的構件 用於將該第二增益因數值應用於該語音 信號之一第二頻率副頻帶以獲得該經處 理語音信號之第二副頻帶的構件 用於基於該複數個雜訊副頻帶功率估 §十、來自該語音信號之資訊及來自加強 向量之資訊來產出一經處理語音信號的 構件 用於將該第一增益因數值應用於級聯之 一第一濾波器級的構件 用於將該第二增益因數值應用於級聯之 一第二濾波器級的構件 比率計算器 平滑器 平滑器 雙麥克風手機 雙麥克風手機 輸入頻道 輸入頻道 峰值限制器 -152- 201013640 M(i) 混合因數 MAX10 最大化器 MAX20 最大化器 MC10 MC20 MC30 MS10 MS20 β MX10 主要麥克風 次要麥克風 第三麥克風 第一平滑信號 第二平滑信號 組合器 MZ10 最小化器 NG100 NGlOOa NGlOOb NGlOOc NL10 NP100 e NPlOOa NPlOOb NPlOOc NP105 NR10 NR20 01 02 雜訊副頻帶信號產生器 第一副頻帶信號產生器 第二副頻帶信號產生器 第三副頻帶信號產生器 雜訊位準指示計算器 雜訊副頻帶功率估計計算器 第一雜訊副頻帶功率估計計算器 第二雜訊副頻帶功率估計計算器 第三副頻帶功率估計計算器 雜訊副頻帶功率估計計算器 雜訊減少級 雜訊減少級 輪出頻道 輪出頬道 140748.doc • 153 201013640
OlO 音訊輸出級 PlOa 類比預處理器 PlOb 類比預處理器 P20a 數位預處理器 P20b 數位預處理器 PM10 預加強處理模組 RIO 接收器 RC10 比率計算器 S(l)-S(q) 副頻帶信號 S(i) 副頻帶信號 S(q) 副頻帶信號 S10 所感測音訊信號 S10-1 所感測音訊頻道 S10-2 所感測音訊頻道 S15-1 頻道 S15-2 頻道 S20 源信號 S30 雜訊參考 S40 語音信號 S45 雜訊減少語音信號 S50 經處理語音信號 S50a 第一經處理語音信號 S50b 第二經處理語音信號 S70 更新控制信號 140748.doc •154· 201013640
S80 模式選擇信號 S95 未經分離之雜訊參考 S100 音訊輸入信號 SC10 對比加強信號 SEL1 選擇器 SEL2 選擇器 SG10 副頻帶濾波器陣列 SG12 副頻帶濾波器陣列 SG20 變換模組 SG30 頻格化模組 SG100 語音副頻帶信號產生器 SG200 副頻帶信號產生器 SG300 副頻帶信號產生器 SG400 副頻帶信號產生器 SL20 選擇器 SL30 選擇器 SL40 選擇器 SL50 選擇器 SM10 頻譜平滑器 SM10-1 類比麥克風信號 SM10-2 類比麥克風信號 SM20 頻譜平滑器 SP10 主要揚聲器 SP20 次要揚聲器 140748.doc -155- 201013640 SP100 語音副頻帶功率估計計算器 SS10 SSP 慮波器 SS20 SSP 濾波器 SS110 SSP 慮波器 SS120 SSP 慮波器 T 經變換信號 T10 任務 T20 任務 T20 任務 T30 任務 T30 任務 T105 任務 T110 任務 T120 任務 T130 任務 T140 任務 T142 任務 T150 任務 T160 任務 T170 任務 T180 任務 T230 任務 T232 任務 T234 任務 140748.doc -156- 201013640 T236 任務 T240 任務 T242 任務 T244 任務 T246 任務 T340 任務 T344 任務 T346 任務 ❹ TM10 任務 TM20 任務 TM30 任務 TRIO 變換模組 TR20 逆變換模組 UC10 更新控制信號 UD10 非相關雜訊偵測器 V10 話音活動偵測器 V15 話音活動偵測器 V20 話音活動偵測器 VC10 自動音量控制模組/聲碼器 VC20 自動音量控制模組 VC30 自動音量控制模組 VG100 加強向量產生器 VG110 加強向量產生器 VG120 加強向量產生器 140748.doc -157- 201013640 VS10 音量控制信號 ΧΙΟ 傳輸器 X100 混合器 Z10 外殼 Z12 圓化橢圓外殼 Z20 聽筒 Z22 聽筒 Z30 耳鉤 Z40 聲埠 Z42 聲埠 Z50 聲埠 Z52 聲埠 140748.doc -158-

Claims (1)

  1. 201013640 七、申請專利範圍: i理:: 理一語音信號之方法,該方法包含在經組態以處 曰訊仏號之-器件内執行以下動作中之每一者: 對一多頻道所感測音訊信號_ 現執仃—空間選擇性處理操 作以產出一源信號及一雜訊參考;及 對該語音信號執行一頻级 Λ 頊'曰對比加強操作以產出一經處 理語音信號, ❹ 其中該執行一頻譜對比加強操作包括: 基於來自該雜訊參考之資訊來計算複數個雜訊副頻 帶功率估計; 基於來自該語音信號之資訊來產生-加強向量;及 基於該複數個雜訊副頻帶功率估計'來自該語音信 :之資訊及來自該加強向量之資訊來產出該經處理語音 k號,且 一其中該經處理語音信號之複數個頻率副頻帶中之每 ❹ 係基於該6^音信號之-相應頻率副頻帶。 2·如請求们之處理—語音信號之方法,其中該執行—空 」選擇性處理操作包括:將該多頻道所感測音訊信號之 方向性分量之能量集中至該源信號中。 呷求項1之處理-語音信號之方法,其中該方法包含 _ 盗件用無線方式接收到之一信號進行解碼以獲得 經解碼語音信號;且 ' Sx居音信號係基於來自該經解碼語音信號之資 訊。 140748.doc 201013640 4.如。月求項1之處理一語音信號之方法 係基主於該多頻道所感測音訊信號。 。…號 5乂=項1之處理一語音信號之方法’其中該執行-空 曰 性處理操作包括:判定在複數個不同頻率中之每 一者下該多頻道所感測音訊信號之頻道的相位母 一關係。 丹 < 間的 6. 如叫求項1之處理一語音信號之方法,其中該產生—加 強向量包含.使該語音信號之—頻譜平滑化以獲得—第 一平滑信號,且使該第一平滑信號平滑化以獲 平滑信號,且 # 一 /、中該加強向量係基於該 信破之一比率 7.如清求項!之處理一語音信號之方法,其中該產生— 強向量包含:減少該語音信號之頻譜峰值之量值之間 一差異,且 曰 …中該加強向量係基於該減少之一結果。 8.如請求们之處理一語音信號之方法,其中該產出一 處理語音信號包含: 計算複數個增益因數值,使得該複數個增益因數值 之每-者係基於來自該加強向量之一相應頻率 資訊; 中之一第一者應用於該語音信 以獲得該經處理語音信號之一 將該複數個增益因數值 號之一第一頻率副頻帶, 第一副頻帶;及 140748.doc 201013640 將該複數個增益因數值中之一第二者應用於該語 號^第二頻率副頻帶,以獲得該經處理語音信號= 第一副頻帶, 同於該複數 其中該複數個增益因數值中之該第一者不 個增益因數值中之該第二者。 9. ® 10. 11. 12. 如請求項8之處理一語音信號之方法,其中該複數個增 益因數值中之每—者係基於該複數個雜訊副頻帶功率估 計中之一相應者。 如請求項8之處理一語音信號之方法,其中該產出一經 處理語音信號包括:使用濾、波器級之—級聯來對該語音 信號進行濾波;且 其中該將該複數個增益因數值中之_第一者應用於該 語音信號之一第一頻率副頻帶包含:將該增益因數值應 用於s玄級聯之—第—濾波器級,且 其中該將該複數個增益因數值中之一第二者應用於該 語音信號之一第二頻率副頻帶包含:將該增益因數值應 用於該級聯之一第二濾波器級。 如請求項1之處理一語音信號之方法,其中該方法包 含: 使用一回音消除器來自該多頻道所感測音訊信號消除 回音;及 使用該經處理語音信號來訓練該回音消除器。 如請求項1之處理一語音信號之方法,其中該方法包 含: 140748.doc 201013640 雜訊 一話 基於來自該雜訊參考之資訊,對該源信號執行一 減少操作以獲得該語音信號;及 基於該源信號與該語音信號之間的—關係來執行 音活動偵測操作, τ 活動偵測 其中該產出一經處理語音信號係基於該話音 操作之一結果。 13· —種用於處理一語音信號之裝置,該裴置包含: 用於對一多頻道所感測音訊信號執行一空間選擇性處 理操作以產出一源信號及一雜訊參考的構件;及 用於對該語音信號執行一頻譜對比加強操作以產出一 經處理語音信號的構件, 其中該用於執行一頻譜對比加強操作的構件包括: —用於基於來自該雜訊參考之資訊來計算複數個雜訊 副頻帶功率估計的構件; 用於基於來自該語音信號之資訊來產生一加強向量 的構件;及 用於基於該複數個雜訊副頻帶功率估計、來自該語 音乜號之育訊及來自該加強向量之資訊來產出該經處理 語音信號的構件, 其中該經處理語音信號之複數個頻率副頻帶中之每— 者係基於該語音信號之一相應頻率副頻帶。 14.如請求項13之用於處理一語音信號之裝置其中該空間 選擇性處理操作包括:將該多頻道所感測音訊信號之— 方向性分量之能量集中至該源信號中。 140748.doc -4- 201013640 15.如請求項13之用於處理一語音信號之裝置,其中該裝置 包含用於對由該裝置用無線方式接收到之一信號進行解 碼以獲得一經解碼語音信號的構件;且 其中該語音信號係基於來自該經解碼語音信號之資 訊。 16, 如請求項13之用於處理一語音信號之裝置’其中該語音 信號係基於該多頻道所感測音訊信號。 17. 參 如請求項13之用於處理一語音信號之裝置,其中該用於 執行空間選擇性處理操作的構件經組態以:判定在複 數個不同頻#中之每一者下肖多頻冑所感測音訊信號之 頻道的相位角之間的一關係。 18 如請求項13之用於處理一語音信號之裝置,纟中該用於 產生一加強向量的構件經組態以:使該語音信號之一頻 4平滑化以獲得一第一平滑信號,且使該第一平滑信號 平滑化以獲得一第二平滑信號,且 其中該加強向量係基於該第—平滑信號與該第二平滑 k號之一比率。 19.如請求項13之用於處理—語音信號之裝置,其中該用於 產生一加強向量的構件經組態以··執行—減少該語音信 號之頻讀峰值之量值之間的一差異的操作,且 其中該加強向量係基於該操作之一結果。 2〇.如請求項13之㈣處理—語音信號之裝置,其中該用於 產出一經處理語音信號的構件包含: 用於計算複數個增益因數值使得該複數個增益因數值 140748.doc 201013640 中之每—者係基於來自該加強向量之-相應頻率副頻帶 之資訊的構件; 用於將該複數個增益因數值中之 〇 矛—有應用於該艰 音信號之—第―頻率副頻帶以獲得該經處理語音信號之 一第一副頻帶的構件;及 立=於將該複數個增制數值中之_第:者應用於該語 音信號之-第二頻率副頻帶以獲得該經處理語音信號之 一第二副頻帶的構件, 其中該複數個增益因數值中之該第一者不同於該複數 個增益因數值中之該第二者。 21. 如請求項20之用於處理一語音信號之農置,丨中該複數 個增盈因數值中之每—者係基於該複數個雜訊副頻帶功 率估計中之一相應者。 22. 如請求項20之用於處理一語音信號之裝置其中該用於 產出-經處理語音信號的構件包括:經配置以對該語音 信號進行濾波的濾波器級之一級聯;且 其中該用於將該複數個增益因數值中之一第一者應用 於該語音信號之一第一頻率副頻帶的構件經組態以將該 增益因數值應用於該級聯之一第一濾波器級,且 其中該用於將該複數個增益因數值中之一第二者鹿用 於該語音信號之一第二頻率副頻帶的構件經組態以將該 增益因數值應用於該級聯之一第二濾波器級。 23. 如請求項13之用於處理一語音信號之裝置,其中該裝置 包含用於自該多頻道所感測音訊信號消除回音的構件;且 140748.doc -6 - 201013640 其中該用於消除回音之構件經組態及經配置以用該細 處理語音信號來加以訓練。 24·如請求項13之用於處理一語音信號之裝置,其中該裝置 包含: 用於基於來自該雜訊參考之資訊對該源信號執行—雜 訊減少操作以獲得該語音信號的構件;及 用於基於該源信號與該語音信號之間的一關係來執行 一話音活動偵測操作的構件, 其中該用於產出一經處理語音信號之構件經組態以基 於該話音活動偵測操作之一結果來產出該經處理語音信 號。 ° 25. —種用於處理一語音信號之裝置,該裝置包含·· 一空間選擇性處理濾波器,其經組態以對一多頻道所 感測音訊信號執行一空間選擇性處理操作以產出一源信 號及一雜訊參考;及 一頻譜對比加強器,其經組態以對該語音信號執行— 頻譜對比加強操作以產出一經處理語音信號, 其中該頻譜對比加強器包括·· :功率估計計算器,其經組態以基於來自該雜訊參 考之資訊來計算複數個雜訊副頻帶功率估計;及 -加強向量產生器,其經組態以基於來自該語音信 號之資訊來產生一加強向量,且 其中該頻譜對比加強器經組態以基於該複數個雜訊 副頻帶功率估計、來自該語音信號之資訊及來自該加強 140748.doc 201013640 向量之資訊來產出該經處理語音信號,且 其中該經處理語音信號之複數個頻率副頻帶中之每一 者係基於該*§·音信號之—相應頻率副頻帶。 26. 27. 28. 29. 30. 31. 如請求項25之用於處理—語音信號之裝置,其中該空間 選擇性處理操作包括:將該多頻道所感測音訊信號之— 方向性分量之能量集中至該源信號中。 如请求項25之用於處理一語音信號之裝置其中該裝置 包含-解碼器,該解碼器經組態以對由該裝置用無線方 式接收到之-信號進行解碼以獲得_經解碼語音信號;且 其中該語音信號係、基於來自該經解褐語音信號之次 訊。 ° J貝 如請求項25之用於處理—語音信號之裝置其中該語音 L號係基於該多頻道所感測音訊信號。 如請求項25之用於處理一語音信號之裝置,其中該空間 選擇性處理操作包括:判定在複數個不同頻率中之每一 者下該多頻道所《測音訊信號之頻道的相位肖之間的一 關係。 ^ 如請求項25之用於處理一語音信號之装置其中該加強 向量產生器經組態以:使該語音信號之—頻譜平滑化以 獲得-第-平滑信號’且使該第一平滑信號平滑化以獲 得一第二平滑信號,且 其中該加強向量係基於該第一平滑信號與該第二平滑 信號之一比率。 ' 如請求項25之用於處理一語音信號之裝置,其中該加強 140748.doc 8 ~ 201013640 向量產生器經組態卩:執行一減少該語音信豸之頻譜峰 值之量值之間的一差異的操作,且 其中該加強向量係基於該操作之一結果。 32. 如請求項25之用於處理—語音信號之^置,其中該頻謹 對比加強器包括: '曰益因數β十算器,其經組態以計算複數個增益因數 值使知該複數個增益因數值令之每一者係基於來自該 加強向量之一相應頻率副頻帶的資訊;及 、曰益控制元件,其經組態以將該複數個增益因數值 中之-第-者應用於該語音信號之一第一頻率副頻帶, 以獲得該經處理語音信號之一第一副頻帶·,且 其中該增益控制元件經組態以將該複數個增益因數值 中之-第二者應用於該語音信號之—第二頻率副頻帶, 以獲得該經處理語音信號之一第二副頻帶, 其中該複數個增益因數值中之該第__者 個増益因數值中之”二者。 Α於〜複數 33. 如請求項32之用於處理一語音信號之裝置 個增益因數值中之每一者#基 、中-複數 + 者係基於該複數個雜訊副頻帶功 率估計中之一相應者。 34:Γ=用於處理一語音信號之裝置,其中該增益 =件經配置以對該語音信號進抒據 器級之一級聯;且 二!增益控制元件經組態以:藉由將讀複數個增益 數值中之5亥第一者應用於該級聯一 乐〜濾波器,來 140748.doc 201013640 將該增益因數值應用於該語音信號之該第一頻率副頻 帶,且 其中該增益控制元件經組態以:藉由將該複數個增益 因數值中之該第二者應用於該級聯之一第二濾波器,來 將S亥增益因數值應用於該語音信號之該第二頻率副頻 帶。 35.如請求項25之用於處理一語音信號之裝置,其中該裝置 包含一回音消除器’該回音消除器經組態以自該多頻道 所感測音訊信號消除回音,且 其中該回音消除器經纽態及經配置以用該經處理語音 信號來加以訓練。 3 6.如。月求項25之用於處理一語音信號之裝置,其中該裝置 包含: 一雜訊減少級,其經組態以基於來自該雜訊參考之資 訊對該源仏號執行一雜訊減少操作,以獲得該語音信 號;及 ° 立,曰活動價測器’其經組態以基於該源信號與該語 音信號,間的—關係來執行一話音活動偵測操作, 。其中。亥頻4對比加強器經組態以基於該話音活動偵測 操作之、。果來產出該經處理語音信號。 37. 一種電腦可讀媒# ^ ^ Α ^ 其包含在由至少一處理器執行時使 該至少一處理器勃 執仃一處理一多頻道音訊信號之方法的 指令,該等指令包含: 在由一處理器 執行時使該處理器對一多頻道所感測音 140748.doc 201013640 訊信號執行—空間選擇性處理操作以產出-源信號及一 雜訊參考的指令;及 在由一處理器執行時使該處理器對語音信號執行 譜對比加強操作以產出一經處理語音信號的指令, 其中在由一處理器執行時使該處理器執行-頻譜對比 加強操作的該等指令包括: 參 參 在由-處理器執行時使該處理器基於來自該 考之資訊來計算複數個雜訊副頻帶功率估計的指令;° 。在由-處理器執行時使該處理器基於來自該語音信 號之資訊來產生—加強向量的指令;及 ° 在由一處理器執行時使該處理器基於該複數個 副頻帶功率估計、來自該語音信號之資訊及來自該加強 向量之資訊來產出-經處理語音信號的指令, 其中該經處理語音信號之複數個頻率副頻帶中之每一 者係基於該语音信號之-相應頻率副頻帶。 38. 如請求項37之電腦可讀媒體,其中在由—處理器執行時 使该處理器執行—空間選擇性處理操作的該等指令包 n由-處理器執行時使該處理器將該多頻道所感測 曰訊L號之-方向性分量的能量集中至該源信號中的指 令。 39. 如請求項37之電腦可讀媒體,其中該媒體包含在由一處 =執行時使該處理器對由—包括該媒體之器件用無線 方式接收到之一传轴· =處進行解碼以獲得一經解碼語音信號 的指令;且 140748.doc -11 - 201013640 40. 41. 42. 43. 44. 其中該語音信號係基於來自該經解碼語音信號之資 訊。 如凊求項37之電腦可讀媒體,其中該語音信號係基於該 多頻道所感測音訊信號。 如凊求項37之電腦可讀媒體,其中在由一處理器執行時 使该處理器執行一空間選擇性處理操作的該等指令包 括.在由一處理器執行時使該處理器判定在複數個不同 頻率中之每一者下該多頻道所感測音訊信號之頻道的相 位角之間的一關係的指令。 如請求項37之電腦可讀媒體,其中在由一處理器執行時 使该處理器產生一加強向量的該等指令包含:在由一處 理器執行時使該處理器使該語音信號之—頻譜平滑化以 獲得一第一平滑信號的指令;及在由一處理器執行時使 該處理器使該第一平滑信號平滑化以獲得一第二平滑信 號的指令,且 其中該加強向量係基於該第一平滑信號與該第二平滑 信號之一比率。 如請求項37之電腦可讀媒體,其中在由一處理器執行時 使該處理器產生一加強向量的該等指令包含:在由—處 理器執行時使該處理器減少該語音信號之頻譜峰值之量 值之間的一差異的指令,且 其中該加強向量係基於該減少之一結果。 如請求項37之電腦可讀媒體,其中在由—處理器執行時 使該處理器產出一經處理語音信號的該等指令包含: 140748.doc •12- 201013640 在由一處理器執行時使該處理器計算複數個增益因數 值使得該複數個增益因數值中之每一者係基於來自該加 強向量之一相應頻率副頻帶的資訊的指令; ❹ 45. 46. 在由一處理器執行時使該處理器將該複數個增益因數 值中之一第一者應用於該語音信號之一第一頻率副頻帶 以獲得該經處理語音信號之一第一副頻帶的指令;及 在由一處理器執行時使該處理器將該複數個增益因數 值中之一第二者應用於該語音信號之一第二頻率副頻帶 以獲得該經處理語音信號之一第二副頻帶的指令, 其中該複數個增益因數值中之該第一者不同於該複數 個增益因數值中之該第二者。 如請求項44之電腦可讀媒體,其中該複數個增益因數值 中之每一者係基於該複數個雜訊副頻帶功率估計中之一 相應者。 如請求項44之電腦可讀媒體,其中在由一處理器執行時 使該處理器產出一經處理語音信號的該等指令包括··在 由一處理器執行時使該處理器使用濾波器級之一級聯來 對該語音信號進行濾波的指令;且 其中在由一處理器執行時使該處理器將該複數個增益 因數值中之一第一者應用於該語音信號之一第一頻率副 頻帶的該等指令包含:在由一處理器執行時使該處理器 將該增益因數值應用於該級聯之一第—濾波器級的指 令,且 其中在由一處理器執行時使該處理器將該複數個增益 140748.doc -13· 201013640 因數值中之一第二者應用於該語音信號之一第二頻率副 頻帶的該等指令包含:在由一處理器執行時使該處理器 將該增益因數值應用於該級聯之一第二濾波器級的指 令0 47·如請求項37之電腦可讀媒體,其中該媒體包含: 在由一處理器執行時使該處理器自該多頻道所感測音 訊信號消除回音的指令;且 其中在由一處理器執行時使該處理器消除回音的該等 指令經組態及經配置以用該經處理語音信號來加以訓 練。 48. 如請求項37之電腦可讀媒體,其中該媒體包含: 在由一處理器執行時使該處理器基於來自該雜訊參考 之資讯對該源信號執行一雜訊減少操作以獲得該語音信 號的指令;及 ° 在由-處理器執行時使該處理器基於該源信號與該語 音信號之間的-關係來執行一話音活動偵測操作的指 令, 其中在由一處理器執行時 處理器產出一經處理語 曰仏號的該等指令經組態 , 態以基於該話音活動偵測操作之 一結果來產出該經處理語音信號。 49. 一種處理一語音信號夕 之方法,該方法包含在 理音訊信號之一器件内鈾$仕丄組態以處 仟内執仃以下動作中之每: 使該浯音信號之—頻譜黑 號; '月匕以獲得一第一平滑信 140748.doc 201013640 使該第一平滑信號平滑化以獲得—第二平滑信號;及 產出一基於該第一平滑信號與該第二平滑信號之一比 率的對比加強語音信號。 50·如請求項49之處理一語音信號之方法,其中該產出一對 比加強語音信號包含:對於該語音信號之複數個副頻帶 中之每一者,基於該第一平滑信號與該第二平滑信號之 該比率的來自—相應副頻帶的資訊來控制該副頻帶之一 增益》
    140748.doc -15-
TW098118088A 2008-05-29 2009-06-01 Systems, methods, apparatus, and computer program products for spectral contrast enhancement TW201013640A (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US5718708P 2008-05-29 2008-05-29
US12/473,492 US8831936B2 (en) 2008-05-29 2009-05-28 Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement

Publications (1)

Publication Number Publication Date
TW201013640A true TW201013640A (en) 2010-04-01

Family

ID=41380870

Family Applications (1)

Application Number Title Priority Date Filing Date
TW098118088A TW201013640A (en) 2008-05-29 2009-06-01 Systems, methods, apparatus, and computer program products for spectral contrast enhancement

Country Status (7)

Country Link
US (1) US8831936B2 (zh)
EP (1) EP2297730A2 (zh)
JP (1) JP5628152B2 (zh)
KR (1) KR101270854B1 (zh)
CN (2) CN103247295B (zh)
TW (1) TW201013640A (zh)
WO (1) WO2009148960A2 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI483624B (zh) * 2012-03-19 2015-05-01 Universal Scient Ind Shanghai 用於收音系統之等化前處理方法及其系統
US9082389B2 (en) 2012-03-30 2015-07-14 Apple Inc. Pre-shaping series filter for active noise cancellation adaptive filter
US9489960B2 (en) 2011-05-13 2016-11-08 Samsung Electronics Co., Ltd. Bit allocating, audio encoding and decoding
TWI691955B (zh) * 2018-03-05 2020-04-21 國立中央大學 多通道之多重音頻串流方法以及使用該方法之系統
TWI712033B (zh) * 2019-03-14 2020-12-01 鴻海精密工業股份有限公司 聲音識別方法、裝置、電腦裝置及存儲介質

Families Citing this family (141)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100754220B1 (ko) * 2006-03-07 2007-09-03 삼성전자주식회사 Mpeg 서라운드를 위한 바이노럴 디코더 및 그 디코딩방법
KR101756834B1 (ko) * 2008-07-14 2017-07-12 삼성전자주식회사 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치
US8538749B2 (en) * 2008-07-18 2013-09-17 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for enhanced intelligibility
US20100057472A1 (en) * 2008-08-26 2010-03-04 Hanks Zeng Method and system for frequency compensation in an audio codec
KR20100057307A (ko) * 2008-11-21 2010-05-31 삼성전자주식회사 노래점수 평가방법 및 이를 이용한 가라오케 장치
US8771204B2 (en) 2008-12-30 2014-07-08 Masimo Corporation Acoustic sensor assembly
US9202456B2 (en) 2009-04-23 2015-12-01 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation
CN102804260B (zh) * 2009-06-19 2014-10-08 富士通株式会社 声音信号处理装置以及声音信号处理方法
US8275148B2 (en) * 2009-07-28 2012-09-25 Fortemedia, Inc. Audio processing apparatus and method
KR101587844B1 (ko) * 2009-08-26 2016-01-22 삼성전자주식회사 마이크로폰의 신호 보상 장치 및 그 방법
WO2011047213A1 (en) * 2009-10-15 2011-04-21 Masimo Corporation Acoustic respiratory monitoring systems and methods
US8821415B2 (en) * 2009-10-15 2014-09-02 Masimo Corporation Physiological acoustic monitoring system
US8790268B2 (en) 2009-10-15 2014-07-29 Masimo Corporation Bidirectional physiological information display
US8755535B2 (en) 2009-10-15 2014-06-17 Masimo Corporation Acoustic respiratory monitoring sensor having multiple sensing elements
CN102714034B (zh) * 2009-10-15 2014-06-04 华为技术有限公司 信号处理的方法、装置和系统
US9324337B2 (en) * 2009-11-17 2016-04-26 Dolby Laboratories Licensing Corporation Method and system for dialog enhancement
US20110125497A1 (en) * 2009-11-20 2011-05-26 Takahiro Unno Method and System for Voice Activity Detection
US9344823B2 (en) 2010-03-22 2016-05-17 Aliphcom Pipe calibration device for calibration of omnidirectional microphones
US8473287B2 (en) 2010-04-19 2013-06-25 Audience, Inc. Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system
US8538035B2 (en) 2010-04-29 2013-09-17 Audience, Inc. Multi-microphone robust noise suppression
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
US8781137B1 (en) 2010-04-27 2014-07-15 Audience, Inc. Wind noise detection and suppression
US9245538B1 (en) * 2010-05-20 2016-01-26 Audience, Inc. Bandwidth enhancement of speech signals assisted by noise reduction
US9053697B2 (en) 2010-06-01 2015-06-09 Qualcomm Incorporated Systems, methods, devices, apparatus, and computer program products for audio equalization
CN101894561B (zh) * 2010-07-01 2015-04-08 西北工业大学 一种基于小波变换和变步长最小均方算法的语音降噪方法
US8447596B2 (en) 2010-07-12 2013-05-21 Audience, Inc. Monaural noise suppression based on computational auditory scene analysis
JP2013533717A (ja) 2010-08-12 2013-08-22 アリフ, インコーポレイテッド クランピングシステムを有する較正システム
US9111526B2 (en) 2010-10-25 2015-08-18 Qualcomm Incorporated Systems, method, apparatus, and computer-readable media for decomposition of a multichannel music signal
US9521015B2 (en) * 2010-12-21 2016-12-13 Genband Us Llc Dynamic insertion of a quality enhancement gateway
CN102075599A (zh) * 2011-01-07 2011-05-25 蔡镇滨 一种降低环境噪声的装置及方法
US10230346B2 (en) * 2011-01-10 2019-03-12 Zhinian Jing Acoustic voice activity detection
JP5411880B2 (ja) * 2011-01-14 2014-02-12 レノボ・シンガポール・プライベート・リミテッド 情報処理装置、その音声設定方法、およびコンピュータが実行するためのプログラム
JP5664265B2 (ja) * 2011-01-19 2015-02-04 ヤマハ株式会社 ダイナミックレンジ圧縮回路
US8762147B2 (en) * 2011-02-02 2014-06-24 JVC Kenwood Corporation Consonant-segment detection apparatus and consonant-segment detection method
WO2012107561A1 (en) * 2011-02-10 2012-08-16 Dolby International Ab Spatial adaptation in multi-microphone sound capture
JP5668553B2 (ja) * 2011-03-18 2015-02-12 富士通株式会社 音声誤検出判別装置、音声誤検出判別方法、およびプログラム
CN102740215A (zh) * 2011-03-31 2012-10-17 Jvc建伍株式会社 声音输入装置、通信装置、及声音输入装置的动作方法
US20120294446A1 (en) * 2011-05-16 2012-11-22 Qualcomm Incorporated Blind source separation based spatial filtering
EP2714184B1 (en) * 2011-05-26 2017-05-10 Advanced Bionics AG Systems for improving representation by an auditory prosthesis system of audio signals having intermediate sound levels
US20130066638A1 (en) * 2011-09-09 2013-03-14 Qnx Software Systems Limited Echo Cancelling-Codec
US9210506B1 (en) * 2011-09-12 2015-12-08 Audyssey Laboratories, Inc. FFT bin based signal limiting
EP2590165B1 (en) * 2011-11-07 2015-04-29 Dietmar Ruwisch Method and apparatus for generating a noise reduced audio signal
DE102011086728B4 (de) 2011-11-21 2014-06-05 Siemens Medical Instruments Pte. Ltd. Hörvorrichtung mit einer Einrichtung zum Verringern eines Mikrofonrauschens und Verfahren zum Verringern eines Mikrofonrauschens
US11553692B2 (en) 2011-12-05 2023-01-17 Radio Systems Corporation Piezoelectric detection coupling of a bark collar
US11470814B2 (en) 2011-12-05 2022-10-18 Radio Systems Corporation Piezoelectric detection coupling of a bark collar
GB2499052A (en) * 2012-02-01 2013-08-07 Continental Automotive Systems Calculating a power value in a vehicular application
US9373341B2 (en) 2012-03-23 2016-06-21 Dolby Laboratories Licensing Corporation Method and system for bias corrected speech level determination
WO2013150340A1 (en) * 2012-04-05 2013-10-10 Nokia Corporation Adaptive audio signal filtering
US8749312B2 (en) * 2012-04-18 2014-06-10 Qualcomm Incorporated Optimizing cascade gain stages in a communication system
US8843367B2 (en) * 2012-05-04 2014-09-23 8758271 Canada Inc. Adaptive equalization system
US9955937B2 (en) 2012-09-20 2018-05-01 Masimo Corporation Acoustic patient sensor coupler
EP2898506B1 (en) * 2012-09-21 2018-01-17 Dolby Laboratories Licensing Corporation Layered approach to spatial audio coding
US9628630B2 (en) * 2012-09-27 2017-04-18 Dolby Laboratories Licensing Corporation Method for improving perceptual continuity in a spatial teleconferencing system
US9147157B2 (en) 2012-11-06 2015-09-29 Qualcomm Incorporated Methods and apparatus for identifying spectral peaks in neuronal spiking representation of a signal
US9424859B2 (en) * 2012-11-21 2016-08-23 Harman International Industries Canada Ltd. System to control audio effect parameters of vocal signals
US9516659B2 (en) * 2012-12-06 2016-12-06 Intel Corporation Carrier type (NCT) information embedded in synchronization signal
US9549271B2 (en) * 2012-12-28 2017-01-17 Korea Institute Of Science And Technology Device and method for tracking sound source location by removing wind noise
DE13750900T1 (de) * 2013-01-08 2016-02-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verbesserung der Sprachverständlichkeit bei Hintergrundrauschen durch SII-abhängige Amplifikation und Kompression
US20140372111A1 (en) * 2013-02-15 2014-12-18 Max Sound Corporation Voice recognition enhancement
US20140372110A1 (en) * 2013-02-15 2014-12-18 Max Sound Corporation Voic call enhancement
US20150006180A1 (en) * 2013-02-21 2015-01-01 Max Sound Corporation Sound enhancement for movie theaters
US9443529B2 (en) * 2013-03-12 2016-09-13 Aawtend, Inc. Integrated sensor-array processor
US9237225B2 (en) * 2013-03-12 2016-01-12 Google Technology Holdings LLC Apparatus with dynamic audio signal pre-conditioning and methods therefor
US9263061B2 (en) * 2013-05-21 2016-02-16 Google Inc. Detection of chopped speech
EP2819429B1 (en) * 2013-06-28 2016-06-22 GN Netcom A/S A headset having a microphone
CN103441962B (zh) * 2013-07-17 2016-04-27 宁波大学 一种基于压缩感知的ofdm系统脉冲干扰抑制方法
US10828007B1 (en) 2013-10-11 2020-11-10 Masimo Corporation Acoustic sensor with attachment portion
US9635456B2 (en) * 2013-10-28 2017-04-25 Signal Interface Group Llc Digital signal processing with acoustic arrays
MX356164B (es) * 2013-11-13 2018-05-16 Fraunhofer Ges Forschung Codificador para codificar una señal de audio, sistema de audio de transmisión y método para determinar valores de corrección.
EP2884491A1 (en) 2013-12-11 2015-06-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Extraction of reverberant sound using microphone arrays
FR3017484A1 (fr) * 2014-02-07 2015-08-14 Orange Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
WO2015130257A1 (en) 2014-02-25 2015-09-03 Intel Corporation Apparatus, system and method of simultaneous transmit and receive (str) wireless communication
TWI571084B (zh) * 2014-03-11 2017-02-11 領特德國公司 用以減輕串擾雜訊之裝置
CN105225661B (zh) * 2014-05-29 2019-06-28 美的集团股份有限公司 语音控制方法和系统
EP3152756B1 (en) * 2014-06-09 2019-10-23 Dolby Laboratories Licensing Corporation Noise level estimation
JP6401521B2 (ja) * 2014-07-04 2018-10-10 クラリオン株式会社 信号処理装置及び信号処理方法
CN105336332A (zh) * 2014-07-17 2016-02-17 杜比实验室特许公司 分解音频信号
US9817634B2 (en) * 2014-07-21 2017-11-14 Intel Corporation Distinguishing speech from multiple users in a computer interaction
WO2016034915A1 (en) * 2014-09-05 2016-03-10 Intel IP Corporation Audio processing circuit and method for reducing noise in an audio signal
MY179448A (en) * 2014-10-02 2020-11-06 Dolby Int Ab Decoding method and decoder for dialog enhancement
US9659578B2 (en) * 2014-11-27 2017-05-23 Tata Consultancy Services Ltd. Computer implemented system and method for identifying significant speech frames within speech signals
WO2016117793A1 (ko) * 2015-01-23 2016-07-28 삼성전자 주식회사 음성 향상 방법 및 시스템
TWI579835B (zh) * 2015-03-19 2017-04-21 絡達科技股份有限公司 音效增益方法
GB2536729B (en) * 2015-03-27 2018-08-29 Toshiba Res Europe Limited A speech processing system and speech processing method
US10559303B2 (en) * 2015-05-26 2020-02-11 Nuance Communications, Inc. Methods and apparatus for reducing latency in speech recognition applications
US9666192B2 (en) 2015-05-26 2017-05-30 Nuance Communications, Inc. Methods and apparatus for reducing latency in speech recognition applications
CN106297813A (zh) 2015-05-28 2017-01-04 杜比实验室特许公司 分离的音频分析和处理
US9734845B1 (en) * 2015-06-26 2017-08-15 Amazon Technologies, Inc. Mitigating effects of electronic audio sources in expression detection
US9401158B1 (en) * 2015-09-14 2016-07-26 Knowles Electronics, Llc Microphone signal fusion
US10373608B2 (en) * 2015-10-22 2019-08-06 Texas Instruments Incorporated Time-based frequency tuning of analog-to-information feature extraction
CN108353225B (zh) * 2015-10-30 2020-09-22 三菱电机株式会社 免提控制装置
US9923592B2 (en) 2015-12-26 2018-03-20 Intel Corporation Echo cancellation using minimal complexity in a device
WO2017119284A1 (ja) * 2016-01-08 2017-07-13 日本電気株式会社 信号処理装置、利得調整方法および利得調整プログラム
US10318813B1 (en) 2016-03-11 2019-06-11 Gracenote, Inc. Digital video fingerprinting using motion segmentation
US11373672B2 (en) 2016-06-14 2022-06-28 The Trustees Of Columbia University In The City Of New York Systems and methods for speech separation and neural decoding of attentional selection in multi-speaker environments
CN107564544A (zh) * 2016-06-30 2018-01-09 展讯通信(上海)有限公司 语音活动侦测方法及装置
CN107871494B (zh) * 2016-09-23 2020-12-11 北京搜狗科技发展有限公司 一种语音合成的方法、装置及电子设备
CN106454642B (zh) * 2016-09-23 2019-01-08 佛山科学技术学院 自适应子带音频反馈抑制方法
US10701483B2 (en) 2017-01-03 2020-06-30 Dolby Laboratories Licensing Corporation Sound leveling in multi-channel sound capture system
US10720165B2 (en) * 2017-01-23 2020-07-21 Qualcomm Incorporated Keyword voice authentication
AU2018224313B2 (en) 2017-02-27 2023-10-12 Radio Systems Corporation Threshold barrier system
GB2561021B (en) * 2017-03-30 2019-09-18 Cirrus Logic Int Semiconductor Ltd Apparatus and methods for monitoring a microphone
CN110800019B (zh) * 2017-06-22 2024-02-06 皇家飞利浦有限公司 用于复合超声图像生成的方法和系统
US11489691B2 (en) 2017-07-12 2022-11-01 Universal Electronics Inc. Apparatus, system and method for directing voice input in a controlling device
US10930276B2 (en) 2017-07-12 2021-02-23 Universal Electronics Inc. Apparatus, system and method for directing voice input in a controlling device
JP6345327B1 (ja) * 2017-09-07 2018-06-20 ヤフー株式会社 音声抽出装置、音声抽出方法および音声抽出プログラム
US11769510B2 (en) 2017-09-29 2023-09-26 Cirrus Logic Inc. Microphone authentication
GB2567018B (en) 2017-09-29 2020-04-01 Cirrus Logic Int Semiconductor Ltd Microphone authentication
US11394196B2 (en) 2017-11-10 2022-07-19 Radio Systems Corporation Interactive application to protect pet containment systems from external surge damage
US11372077B2 (en) 2017-12-15 2022-06-28 Radio Systems Corporation Location based wireless pet containment system using single base unit
CN108333568B (zh) * 2018-01-05 2021-10-22 大连大学 冲击噪声环境下基于Sigmoid变换的宽带回波Doppler和时延估计方法
US11322164B2 (en) * 2018-01-18 2022-05-03 Dolby Laboratories Licensing Corporation Methods and devices for coding soundfield representation signals
US10657981B1 (en) * 2018-01-19 2020-05-19 Amazon Technologies, Inc. Acoustic echo cancellation with loudspeaker canceling beamformer
CN108198570B (zh) * 2018-02-02 2020-10-23 北京云知声信息技术有限公司 审讯时语音分离的方法及装置
US10524048B2 (en) 2018-04-13 2019-12-31 Bose Corporation Intelligent beam steering in microphone array
CN108717855B (zh) * 2018-04-27 2020-07-28 深圳市沃特沃德股份有限公司 噪音处理方法与装置
US10951996B2 (en) * 2018-06-28 2021-03-16 Gn Hearing A/S Binaural hearing device system with binaural active occlusion cancellation
CN109104683B (zh) * 2018-07-13 2021-02-02 深圳市小瑞科技股份有限公司 一种双麦克风相位测量校正的方法及校正系统
TW202008800A (zh) * 2018-07-31 2020-02-16 塞席爾商元鼎音訊股份有限公司 助聽器及其助聽器之輸出語音調整之方法
CN110875045A (zh) * 2018-09-03 2020-03-10 阿里巴巴集团控股有限公司 一种语音识别方法、智能设备和智能电视
CN111048107B (zh) * 2018-10-12 2022-09-23 北京微播视界科技有限公司 音频处理方法和装置
US10694298B2 (en) * 2018-10-22 2020-06-23 Zeev Neumeier Hearing aid
CN113631030A (zh) * 2019-02-04 2021-11-09 无线电系统公司 用于提供声音掩蔽环境的系统和方法
US11049509B2 (en) * 2019-03-06 2021-06-29 Plantronics, Inc. Voice signal enhancement for head-worn audio devices
CN109905808B (zh) * 2019-03-13 2021-12-07 北京百度网讯科技有限公司 用于调节智能语音设备的方法和装置
US11031024B2 (en) 2019-03-14 2021-06-08 Boomcloud 360, Inc. Spatially aware multiband compression system with priority
CN111986695B (zh) * 2019-05-24 2023-07-25 中国科学院声学研究所 一种无重叠子带划分快速独立向量分析语音盲分离方法及系统
US11238889B2 (en) 2019-07-25 2022-02-01 Radio Systems Corporation Systems and methods for remote multi-directional bark deterrence
US11972767B2 (en) * 2019-08-01 2024-04-30 Dolby Laboratories Licensing Corporation Systems and methods for covariance smoothing
US11172294B2 (en) * 2019-12-27 2021-11-09 Bose Corporation Audio device with speech-based audio signal processing
CN113223544B (zh) * 2020-01-21 2024-04-02 珠海市煊扬科技有限公司 音频的方向定位侦测装置及方法以及音频处理系统
CN111294474B (zh) * 2020-02-13 2021-04-16 杭州国芯科技股份有限公司 一种双端通话检测方法
CN111402918B (zh) * 2020-03-20 2023-08-08 北京达佳互联信息技术有限公司 一种音频处理方法、装置、设备及存储介质
US11490597B2 (en) 2020-07-04 2022-11-08 Radio Systems Corporation Systems, methods, and apparatus for establishing keep out zones within wireless containment regions
CN113949978A (zh) * 2020-07-17 2022-01-18 通用微(深圳)科技有限公司 声音采集装置、声音处理设备及方法、装置、存储介质
CN113949979A (zh) * 2020-07-17 2022-01-18 通用微(深圳)科技有限公司 声音采集装置、声音处理设备及方法、装置、存储介质
CN112201267A (zh) * 2020-09-07 2021-01-08 北京达佳互联信息技术有限公司 一种音频处理方法、装置、电子设备及存储介质
CN113008851B (zh) * 2021-02-20 2024-04-12 大连海事大学 一种基于斜入式激发提高共聚焦结构微弱信号检测信噪比的装置
KR20220136750A (ko) 2021-04-01 2022-10-11 삼성전자주식회사 사용자 발화를 처리하는 전자 장치, 및 그 전자 장치의 제어 방법
CN113190508B (zh) * 2021-04-26 2023-05-05 重庆市规划和自然资源信息中心 一种面向管理的自然语言识别方法
CN114745026B (zh) * 2022-04-12 2023-10-20 重庆邮电大学 一种基于深度饱和脉冲噪声的自动增益控制方法

Family Cites Families (128)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4641344A (en) 1984-01-06 1987-02-03 Nissan Motor Company, Limited Audio equipment
CN85105410B (zh) 1985-07-15 1988-05-04 日本胜利株式会社 降低噪音系统
US5105377A (en) 1990-02-09 1992-04-14 Noise Cancellation Technologies, Inc. Digital virtual earth active cancellation system
JP2797616B2 (ja) * 1990-03-16 1998-09-17 松下電器産業株式会社 雑音抑圧装置
JPH06503897A (ja) 1990-09-14 1994-04-28 トッドター、クリス ノイズ消去システム
US5388185A (en) 1991-09-30 1995-02-07 U S West Advanced Technologies, Inc. System for adaptive processing of telephone voice signals
WO1993026085A1 (en) 1992-06-05 1993-12-23 Noise Cancellation Technologies Active/passive headset with speech filter
CA2136950C (en) 1992-06-05 1999-03-09 David Claybaugh Active plus selective headset
JPH06175691A (ja) * 1992-12-07 1994-06-24 Gijutsu Kenkyu Kumiai Iryo Fukushi Kiki Kenkyusho 音声強調装置と音声強調方法
US7103188B1 (en) 1993-06-23 2006-09-05 Owen Jones Variable gain active noise cancelling system with improved residual noise sensing
US5485515A (en) 1993-12-29 1996-01-16 At&T Corp. Background noise compensation in a telephone network
US5526419A (en) 1993-12-29 1996-06-11 At&T Corp. Background noise compensation in a telephone set
US5764698A (en) 1993-12-30 1998-06-09 International Business Machines Corporation Method and apparatus for efficient compression of high quality digital audio
US6885752B1 (en) 1994-07-08 2005-04-26 Brigham Young University Hearing aid device incorporating signal processing techniques
US5646961A (en) 1994-12-30 1997-07-08 Lucent Technologies Inc. Method for noise weighting filtering
JP2993396B2 (ja) 1995-05-12 1999-12-20 三菱電機株式会社 音声加工フィルタ及び音声合成装置
JPH096391A (ja) * 1995-06-22 1997-01-10 Ono Sokki Co Ltd 信号推定装置
EP0763818B1 (en) 1995-09-14 2003-05-14 Kabushiki Kaisha Toshiba Formant emphasis method and formant emphasis filter device
US6002776A (en) 1995-09-18 1999-12-14 Interval Research Corporation Directional acoustic signal processor and method therefor
US5794187A (en) 1996-07-16 1998-08-11 Audiological Engineering Corporation Method and apparatus for improving effective signal to noise ratios in hearing aids and other communication systems used in noisy environments without loss of spectral information
US6240192B1 (en) 1997-04-16 2001-05-29 Dspfactory Ltd. Apparatus for and method of filtering in an digital hearing aid, including an application specific integrated circuit and a programmable digital signal processor
DE19806015C2 (de) 1998-02-13 1999-12-23 Siemens Ag Verfahren zur Verbesserung der akustischen Rückhördämpfung in Freisprecheinrichtungen
DE19805942C1 (de) * 1998-02-13 1999-08-12 Siemens Ag Verfahren zur Verbesserung der akustischen Rückhördämpfung in Freisprecheinrichtungen
US6415253B1 (en) 1998-02-20 2002-07-02 Meta-C Corporation Method and apparatus for enhancing noise-corrupted speech
US6411927B1 (en) * 1998-09-04 2002-06-25 Matsushita Electric Corporation Of America Robust preprocessing signal equalization system and method for normalizing to a target environment
JP3459363B2 (ja) 1998-09-07 2003-10-20 日本電信電話株式会社 雑音低減処理方法、その装置及びプログラム記憶媒体
US7031460B1 (en) 1998-10-13 2006-04-18 Lucent Technologies Inc. Telephonic handset employing feed-forward noise cancellation
US6993480B1 (en) 1998-11-03 2006-01-31 Srs Labs, Inc. Voice intelligibility enhancement system
US6233549B1 (en) 1998-11-23 2001-05-15 Qualcomm, Inc. Low frequency spectral enhancement system and method
DE50012821D1 (de) 1999-02-26 2006-06-29 Infineon Technologies Ag Vorrichtung und verfahren zur geräuschunterdrückung in fernsprecheinrichtungen
US6704428B1 (en) 1999-03-05 2004-03-09 Michael Wurtz Automatic turn-on and turn-off control for battery-powered headsets
AU4278300A (en) 1999-04-26 2000-11-10 Dspfactory Ltd. Loudness normalization control for a digital hearing aid
AU6748600A (en) 1999-07-28 2001-02-19 Clear Audio Ltd. Filter banked gain control of audio in a noisy environment
JP2001056693A (ja) 1999-08-20 2001-02-27 Matsushita Electric Ind Co Ltd 騒音低減装置
EP1081685A3 (en) 1999-09-01 2002-04-24 TRW Inc. System and method for noise reduction using a single microphone
US6732073B1 (en) * 1999-09-10 2004-05-04 Wisconsin Alumni Research Foundation Spectral enhancement of acoustic signals to provide improved recognition of speech
US6480610B1 (en) 1999-09-21 2002-11-12 Sonic Innovations, Inc. Subband acoustic feedback cancellation in hearing aids
AUPQ366799A0 (en) 1999-10-26 1999-11-18 University Of Melbourne, The Emphasis of short-duration transient speech features
CA2290037A1 (en) 1999-11-18 2001-05-18 Voiceage Corporation Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals
US20070110042A1 (en) 1999-12-09 2007-05-17 Henry Li Voice and data exchange over a packet based network
US6757395B1 (en) 2000-01-12 2004-06-29 Sonic Innovations, Inc. Noise reduction apparatus and method
JP2001292491A (ja) 2000-02-03 2001-10-19 Alpine Electronics Inc イコライザ装置
US7742927B2 (en) 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
US6678651B2 (en) 2000-09-15 2004-01-13 Mindspeed Technologies, Inc. Short-term enhancement in CELP speech coding
US7010480B2 (en) 2000-09-15 2006-03-07 Mindspeed Technologies, Inc. Controlling a weighting filter based on the spectral content of a speech signal
US7206418B2 (en) * 2001-02-12 2007-04-17 Fortemedia, Inc. Noise suppression for a wireless communication device
US6616481B2 (en) 2001-03-02 2003-09-09 Sumitomo Wiring Systems, Ltd. Connector
US20030028386A1 (en) 2001-04-02 2003-02-06 Zinser Richard L. Compressed domain universal transcoder
EP1251714B2 (en) 2001-04-12 2015-06-03 Sound Design Technologies Ltd. Digital hearing aid system
DK1251715T4 (da) 2001-04-18 2011-01-10 Sound Design Technologies Ltd Flerkanalshøreapparat med kommunikation mellem kanalerne
US6820054B2 (en) 2001-05-07 2004-11-16 Intel Corporation Audio signal processing for speech communication
JP4145507B2 (ja) 2001-06-07 2008-09-03 松下電器産業株式会社 音質音量制御装置
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
CA2354755A1 (en) 2001-08-07 2003-02-07 Dspfactory Ltd. Sound intelligibilty enhancement using a psychoacoustic model and an oversampled filterbank
US7277554B2 (en) 2001-08-08 2007-10-02 Gn Resound North America Corporation Dynamic range compression using digital frequency warping
EP1466321A2 (en) * 2002-01-09 2004-10-13 Koninklijke Philips Electronics N.V. Audio enhancement system having a spectral power ratio dependent processor
JP2003218745A (ja) 2002-01-22 2003-07-31 Asahi Kasei Microsystems Kk ノイズキャンセラ及び音声検出装置
US6748009B2 (en) 2002-02-12 2004-06-08 Interdigital Technology Corporation Receiver for wireless telecommunication stations and method
JP2003271191A (ja) 2002-03-15 2003-09-25 Toshiba Corp 音声認識用雑音抑圧装置及び方法、音声認識装置及び方法並びにプログラム
CA2388352A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for frequency-selective pitch enhancement of synthesized speed
US6968171B2 (en) 2002-06-04 2005-11-22 Sierra Wireless, Inc. Adaptive noise reduction system for a wireless receiver
WO2004008801A1 (en) 2002-07-12 2004-01-22 Widex A/S Hearing aid and a method for enhancing speech intelligibility
AU2003256653A1 (en) 2002-07-24 2004-02-09 Massachusetts Institute Of Technology System and method for distributed gain control for spectrum enhancement
US7336662B2 (en) * 2002-10-25 2008-02-26 Alcatel Lucent System and method for implementing GFR service in an access node's ATM switch fabric
WO2004040555A1 (ja) 2002-10-31 2004-05-13 Fujitsu Limited 音声強調装置
US7242763B2 (en) 2002-11-26 2007-07-10 Lucent Technologies Inc. Systems and methods for far-end noise reduction and near-end noise compensation in a mixed time-frequency domain compander to improve signal quality in communications systems
KR100480789B1 (ko) 2003-01-17 2005-04-06 삼성전자주식회사 피드백 구조를 이용한 적응적 빔 형성방법 및 장치
DE10308483A1 (de) 2003-02-26 2004-09-09 Siemens Audiologische Technik Gmbh Verfahren zur automatischen Verstärkungseinstellung in einem Hörhilfegerät sowie Hörhilfegerät
JP4018571B2 (ja) 2003-03-24 2007-12-05 富士通株式会社 音声強調装置
US7330556B2 (en) 2003-04-03 2008-02-12 Gn Resound A/S Binaural signal enhancement system
WO2004097799A1 (en) 2003-04-24 2004-11-11 Massachusetts Institute Of Technology System and method for spectral enhancement employing compression and expansion
SE0301273D0 (sv) 2003-04-30 2003-04-30 Coding Technologies Sweden Ab Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods
JP4486646B2 (ja) 2003-05-28 2010-06-23 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション オーディオ信号の感知音量を計算し調整する方法、装置及びコンピュータプログラム
JP4583781B2 (ja) 2003-06-12 2010-11-17 アルパイン株式会社 音声補正装置
JP2005004013A (ja) 2003-06-12 2005-01-06 Pioneer Electronic Corp ノイズ低減装置
DE60304859T2 (de) 2003-08-21 2006-11-02 Bernafon Ag Verfahren zur Verarbeitung von Audiosignalen
US7099821B2 (en) * 2003-09-12 2006-08-29 Softmax, Inc. Separation of target acoustic signals in a multi-transducer arrangement
DE10351793B4 (de) 2003-11-06 2006-01-12 Herbert Buchner Adaptive Filtervorrichtung und Verfahren zum Verarbeiten eines akustischen Eingangssignals
JP2005168736A (ja) 2003-12-10 2005-06-30 Aruze Corp 遊技機
WO2005069275A1 (en) 2004-01-06 2005-07-28 Koninklijke Philips Electronics, N.V. Systems and methods for automatically equalizing audio signals
ATE402468T1 (de) 2004-03-17 2008-08-15 Harman Becker Automotive Sys Geräuschabstimmungsvorrichtung, verwendung derselben und geräuschabstimmungsverfahren
TWI238012B (en) 2004-03-24 2005-08-11 Ou-Huang Lin Circuit for modulating audio signals in two channels of television to generate audio signal of center third channel
CN1322488C (zh) 2004-04-14 2007-06-20 华为技术有限公司 一种语音增强的方法
US7492889B2 (en) 2004-04-23 2009-02-17 Acoustic Technologies, Inc. Noise suppression based on bark band wiener filtering and modified doblinger noise estimate
TWI279775B (en) 2004-07-14 2007-04-21 Fortemedia Inc Audio apparatus with active noise cancellation
CA2481629A1 (en) 2004-09-15 2006-03-15 Dspfactory Ltd. Method and system for active noise cancellation
EP1640971B1 (en) 2004-09-23 2008-08-20 Harman Becker Automotive Systems GmbH Multi-channel adaptive speech signal processing with noise reduction
US7676362B2 (en) 2004-12-31 2010-03-09 Motorola, Inc. Method and apparatus for enhancing loudness of a speech signal
US7903824B2 (en) 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
US20080243496A1 (en) 2005-01-21 2008-10-02 Matsushita Electric Industrial Co., Ltd. Band Division Noise Suppressor and Band Division Noise Suppressing Method
US8102872B2 (en) 2005-02-01 2012-01-24 Qualcomm Incorporated Method for discontinuous transmission and accurate reproduction of background noise information
US20060262938A1 (en) 2005-05-18 2006-11-23 Gauger Daniel M Jr Adapted audio response
US8280730B2 (en) 2005-05-25 2012-10-02 Motorola Mobility Llc Method and apparatus of increasing speech intelligibility in noisy environments
US8566086B2 (en) 2005-06-28 2013-10-22 Qnx Software Systems Limited System for adaptive enhancement of speech signals
KR100800725B1 (ko) 2005-09-07 2008-02-01 삼성전자주식회사 이동통신 단말의 오디오 재생시 주변 잡음에 적응하는 자동음량 조절 방법 및 장치
ES2940283T3 (es) 2006-01-27 2023-05-05 Dolby Int Ab Filtración eficiente con un banco de filtros modulado complejo
US7590523B2 (en) * 2006-03-20 2009-09-15 Mindspeed Technologies, Inc. Speech post-processing using MDCT coefficients
US7729775B1 (en) * 2006-03-21 2010-06-01 Advanced Bionics, Llc Spectral contrast enhancement in a cochlear implant speech processor
US7676374B2 (en) 2006-03-28 2010-03-09 Nokia Corporation Low complexity subband-domain filtering in the case of cascaded filter banks
GB2479673B (en) 2006-04-01 2011-11-30 Wolfson Microelectronics Plc Ambient noise-reduction control system
US7720455B2 (en) 2006-06-30 2010-05-18 St-Ericsson Sa Sidetone generation for a wireless system that uses time domain isolation
US8185383B2 (en) 2006-07-24 2012-05-22 The Regents Of The University Of California Methods and apparatus for adapting speech coders to improve cochlear implant performance
JP4455551B2 (ja) 2006-07-31 2010-04-21 株式会社東芝 音響信号処理装置、音響信号処理方法、音響信号処理プログラム、及び音響信号処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2008122729A (ja) 2006-11-14 2008-05-29 Sony Corp ノイズ低減装置、ノイズ低減方法、ノイズ低減プログラムおよびノイズ低減音声出力装置
US7401442B2 (en) * 2006-11-28 2008-07-22 Roger A Clark Portable panel construction and method for making the same
ATE435572T1 (de) 2006-12-01 2009-07-15 Siemens Audiologische Technik Hörgerät mit störschallunterdrückung und entsprechendes verfahren
JP4882773B2 (ja) 2007-02-05 2012-02-22 ソニー株式会社 信号処理装置、信号処理方法
US8160273B2 (en) * 2007-02-26 2012-04-17 Erik Visser Systems, methods, and apparatus for signal separation using data driven techniques
JP5034595B2 (ja) 2007-03-27 2012-09-26 ソニー株式会社 音響再生装置および音響再生方法
US7742746B2 (en) 2007-04-30 2010-06-22 Qualcomm Incorporated Automatic volume and dynamic range adjustment for mobile audio devices
WO2008138349A2 (en) 2007-05-10 2008-11-20 Microsound A/S Enhanced management of sound provided via headphones
US8600516B2 (en) 2007-07-17 2013-12-03 Advanced Bionics Ag Spectral contrast enhancement in a cochlear implant speech processor
US8489396B2 (en) 2007-07-25 2013-07-16 Qnx Software Systems Limited Noise reduction with integrated tonal noise reduction
US8428661B2 (en) 2007-10-30 2013-04-23 Broadcom Corporation Speech intelligibility in telephones with multiple microphones
CN101904098B (zh) 2007-12-20 2014-10-22 艾利森电话股份有限公司 噪声抑制方法和设备
US20090170550A1 (en) 2007-12-31 2009-07-02 Foley Denis J Method and Apparatus for Portable Phone Based Noise Cancellation
DE102008039329A1 (de) 2008-01-25 2009-07-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Berechnung von Steuerinformationen für ein Echounterdrückungsfilter und Vorrichtung und Verfahren zur Berechnung eines Verzögerungswerts
US8600740B2 (en) 2008-01-28 2013-12-03 Qualcomm Incorporated Systems, methods and apparatus for context descriptor transmission
US9142221B2 (en) 2008-04-07 2015-09-22 Cambridge Silicon Radio Limited Noise reduction
US8131541B2 (en) 2008-04-25 2012-03-06 Cambridge Silicon Radio Limited Two microphone noise reduction system
US8538749B2 (en) 2008-07-18 2013-09-17 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for enhanced intelligibility
US9202455B2 (en) 2008-11-24 2015-12-01 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for enhanced active noise cancellation
US9202456B2 (en) 2009-04-23 2015-12-01 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation
US20100296666A1 (en) 2009-05-25 2010-11-25 National Chin-Yi University Of Technology Apparatus and method for noise cancellation in voice communication
US8737636B2 (en) 2009-07-10 2014-05-27 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for adaptive active noise cancellation
US20110099010A1 (en) 2009-10-22 2011-04-28 Broadcom Corporation Multi-channel noise suppression system
US9053697B2 (en) 2010-06-01 2015-06-09 Qualcomm Incorporated Systems, methods, devices, apparatus, and computer program products for audio equalization
US20120263317A1 (en) 2011-04-13 2012-10-18 Qualcomm Incorporated Systems, methods, apparatus, and computer readable media for equalization

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9489960B2 (en) 2011-05-13 2016-11-08 Samsung Electronics Co., Ltd. Bit allocating, audio encoding and decoding
TWI562133B (en) * 2011-05-13 2016-12-11 Samsung Electronics Co Ltd Bit allocating method and non-transitory computer-readable recording medium
TWI576829B (zh) * 2011-05-13 2017-04-01 三星電子股份有限公司 位元配置裝置
US9711155B2 (en) 2011-05-13 2017-07-18 Samsung Electronics Co., Ltd. Noise filling and audio decoding
US9773502B2 (en) 2011-05-13 2017-09-26 Samsung Electronics Co., Ltd. Bit allocating, audio encoding and decoding
US10109283B2 (en) 2011-05-13 2018-10-23 Samsung Electronics Co., Ltd. Bit allocating, audio encoding and decoding
US10276171B2 (en) 2011-05-13 2019-04-30 Samsung Electronics Co., Ltd. Noise filling and audio decoding
TWI483624B (zh) * 2012-03-19 2015-05-01 Universal Scient Ind Shanghai 用於收音系統之等化前處理方法及其系統
US9082389B2 (en) 2012-03-30 2015-07-14 Apple Inc. Pre-shaping series filter for active noise cancellation adaptive filter
TWI508060B (zh) * 2012-03-30 2015-11-11 Apple Inc 用於主動雜訊消除可調適性濾波器之預成形串聯濾波器
TWI691955B (zh) * 2018-03-05 2020-04-21 國立中央大學 多通道之多重音頻串流方法以及使用該方法之系統
TWI712033B (zh) * 2019-03-14 2020-12-01 鴻海精密工業股份有限公司 聲音識別方法、裝置、電腦裝置及存儲介質

Also Published As

Publication number Publication date
US20090299742A1 (en) 2009-12-03
JP5628152B2 (ja) 2014-11-19
WO2009148960A2 (en) 2009-12-10
KR20110025667A (ko) 2011-03-10
CN102047326A (zh) 2011-05-04
CN103247295B (zh) 2016-02-24
KR101270854B1 (ko) 2013-06-05
WO2009148960A3 (en) 2010-02-18
CN103247295A (zh) 2013-08-14
JP2011522294A (ja) 2011-07-28
US8831936B2 (en) 2014-09-09
EP2297730A2 (en) 2011-03-23

Similar Documents

Publication Publication Date Title
TW201013640A (en) Systems, methods, apparatus, and computer program products for spectral contrast enhancement
KR101228398B1 (ko) 향상된 명료도를 위한 시스템, 방법, 장치 및 컴퓨터 프로그램 제품
JP6009619B2 (ja) 空間的選択音声拡張のためのシステム、方法、装置、およびコンピュータ可読媒体
US8175291B2 (en) Systems, methods, and apparatus for multi-microphone based speech enhancement
CN102947878B (zh) 用于音频均衡的系统、方法、装置和设备
JP5038550B1 (ja) ロバストな雑音低減のためのマイクロフォンアレイサブセット選択
US8724829B2 (en) Systems, methods, apparatus, and computer-readable media for coherence detection
US20120263317A1 (en) Systems, methods, apparatus, and computer readable media for equalization
TW201030733A (en) Systems, methods, apparatus, and computer program products for enhanced active noise cancellation
CN101031956A (zh) 用于嘈杂环境中语音信号分离的头戴式耳机
TW201132138A (en) Systems, methods, apparatus, and computer-readable media for phase-based processing of multichannel signal
JP2011523836A (ja) マルチチャネル信号のバランスをとるためのシステム、方法及び装置
CN110447069A (zh) 自适应噪声环境的语音信号处理的方法和装置